一种改进的协同过滤推荐算法

来源：华佗小知识

研究与开发　文章编号：１００７－１４２３（２０１７）１５—０００８—０６　ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１００７—１４２３．２０１７．１５．００２　一种改进的协同过滤推荐算法　王茜．王艳明　（重庆大学计算机学院，重庆４０００４４）　摘要：　在协同过滤推荐系统中，商品被视为特征，用户提供他们对购买的商品的评分。通过对用户评分的学习．推荐系统可　以向用户推荐他们可能需要的产品。然而电子商务通常有相当多的产品，如果在推荐前要对每一个商品都进行考虑．　推荐系统将是非常低效的。提出一种改进的ＩｔｅｍＲａｎｋ方法，应用自构建聚类算法来减少商品数量相关的维度．然后　直接在聚类上运行推荐算法。最后，对推荐聚类进行变换得到推荐商品列表推荐给不同的用户。所提出的方法在计算　推荐商品时所需的时间大大减少。实验结果表明，在不影响推荐质量的前提下。推荐系统的效率得到了提高。　关键词：　协同过滤推荐系统：ＩｔｅｍＲａｎｋ　０　引言　随着网络的快速发展．网络商店中商品的数量、种　类变得越来越多．网络购物的人群也越来越多。从如此　细信息　相反．它通过用户和商品之间的交互信息向用　户推荐商品．通常交互信息表示为用户对购买的商品　的评分　通过对用户项目评分矩阵的分析．系统可以向　数量众多、种类繁杂的商品中选择适合自己的商品也　他们推送和他们有相同兴趣用户购买的而且他们还没　变得越来越困难　因此．推荐系统应运而生．以帮助人　们在网上找到他们感兴趣的商品．节约他们的检索时　间『ｌ１　对于用户来说，推荐系统可以通过他们的购买、浏　览记录分析出他们的喜好．从而把他们感兴趣的商品　推荐给他们　在过去的几年中．推荐系统得到了快速的　发展．在本质上。他们可以分为两类。基于内容和协同　过滤．虽然近几年来混合系统［２１趋势不断增长。　有购买的商品　总体来说协同过滤系统更易实现和高　效。　然而网络商店中通常有相当多的产品．如果在推　荐前要对每一个商品都进行考虑．推荐系统将是非常　低效的　降维技术已经在面对大规模数据产生快速、高　效推荐系统中得到了广泛的应用。Ｋ—ｍｅａｎｓ的一种变　形Ｂ—Ｋｍｅａｎｓ［９１算法已经应用在对用户进行不同的划分　基于内容的推荐系统根据产品的类别和其他属性　等内容向用户推荐商品。通过一些技术分析这些数据。　如贝叶斯模型＿３】．基于内容的推荐系统向用户推荐那些　中　通过分析给定用户所属的分区中用户的邻域．向用　户推荐商品。Ｂａ　ＱＶＯｌ等人将用户按照性别、年龄、职业　等属性分组．然后用户项目评分矩阵重组后再计算两　最有吸引力的商品　一般来说基于内容的推荐系统需　要商品和用户的详细信息．它可以向用户推荐新商品，　但是它需求的信息是巨大的．而且很难获取所有用户　和商品的属性及其他信息。此外收集代表用户或商品　的唯一属性也很难　个用户之间的相似度　ＣＡＩｖ　］等人用模糊聚类方法运用　到用户上对用户进行聚类．利用用户组特征向量代表　用户．对用户代表的维度降维　ＳａｒｗａｔＩ１２］等人在一个框　架内使用三种类型的基于位置的评级的分类法产生推　荐．利用用户划分和旅行点向查询用户推送跟接近的　候选人　在ＰＲＭ２１１３］算法中，个人兴趣、人际关系相似性　协同过滤推荐系统　不需要用户或商品属性的详　０　现代计算机２０１７．０５中　翻蜜与　发　／　和人际影响被融合成一个统一的个性化推荐模型，并　且使用奇异值分解（ＳＶＤ）来对原始的用户项目评分矩　阵进行降维　ＩＣＣＲＳ㈣算法是一种迭代评分算法，它对　有偏见的评价者有很大的鲁棒性，与之前的迭代方法　不同．它不是基于将提交的评分与最终评分的近似进　行比较．而是完全将评分评估的可信度与排名本身分　离．这使得它比先前的迭代过滤算法对复杂的攻击有　更强的鲁棒性　上述基于维度降低的推荐系统具有一些缺点。一　些系统［１０，１２１需要关于用户或商品的额外属性来将用户　或商品进行聚类．而这些属性通常是很难在实际应用　中得到的　另一些系统［１１，１５］需要预先给出聚类的数量，　这对用户来说是很难确定的。只能通过重复训练．这是　一个很大的负担　此外．使用降维的推荐系统在计算相　似性的时候仅仅考虑聚类的中心．忽略聚类的方差可　能导致推荐结果的不精确　在本文中．我们提出了一种改进的ＩｔｅｎＲａｎｋ方法．　应用自构建聚类算法来减少商品的维度．创建出商品　聚类之间相互关系的相关图　然后执行一系列的随机　游动．为每个用户生成商品聚类的推荐列表　最后执行　将商品聚类推荐列表转换成单个商品的推荐列表。利　用我们提出的方法．不需要搜集用户和商品的额外属　性信息．而且不需要用户提供预定的聚类数量。此外。　在计算相似性的时候我们不仅考虑聚类中心．还应用　聚类方差等因素　由于商品数量维度的减少．我们提出　推荐商品的处理时间也大大减少　１　相关算法　假设一个有Ｎ个用户的集合“　，１≤ｉ≤Ⅳ，一个有　个商品的集合］９ｉ，１≤ｉ≤Ｍ。用户“　通过对商品］９ｉ的　评分　（　为一个正整数）来表达自己对商品的喜好程　度。通常，评分越高表明用户对商品的喜好程度越高。　如果用户Ｍ　未提供对商品Ｐ　的评分　．ＦＯ。这些信息用　一个用户项目评分矩阵来表示尺：　尺１　Ｒ＝　尺２　●　：　此矩阵为Ⅳ×　矩阵，把Ｒ　记为ＲＦ［　…　，　１≤　≤Ⅳ。矩阵Ｒ的每一行代表一个用户，每一列代表　／　一个商品　协同过滤推荐系统的目标是给定用户项目　评分矩阵．预测用户对商品的喜好程度，向用户推荐商　品。　ＩｔｅｍＲａｎ　ｋ【　６－　是协同过滤推荐的基本方法之一。它　应用基于图模型的推荐算法．通过项目（商品）节点来　构图．形成项目间的关联关系图并计算得到用户的偏　好向量．然后利用随机游走算法预测用户对项目的预　测评分。最后向用户推荐生成的Ｔ０ｐ—Ｋ商品。在关联关　系图创建步骤中，每个节点都是一个商品，商品节点Ｐ　与ｐ　之间的连线Ｗ“具有的权重是同时购买商品Ｐ　和　Ｐｉ的数量　构建完关联关系图后得到矩阵　：　Ｗ１１　Ｗ１２　…　ｌＭ　Ｗ２１　Ｗ＝　‘‘‘　Ｗ２Ｍ　（２）　此矩阵为ＭｘＭ矩阵．然后对矩阵　的每一列进　行归一化　在随机游走算法中，假设用户Ｕｉ，１≤ｉ≤Ｎ．　设．ｓ　（０）＝『１／　１／Ｍ…１／Ｍ］　，然后执行Ｓ　（ｔ＋１）＝　ａＷＳ　（ｔ）＋（　—Ｏ１）Ｒ　操作，ｔ＝０，１，２，…，直至达到收敛。　Ｏ／∈『０，１１是用户定义的一个常数。通常Ｏ／取０．８５，在执　行２０次迭代后达到收敛效果。设Ｓ　为收敛后的向量，　即用户Ｕｉ的预测偏好列表。然后可以根据Ｓ　中元素的　大小顺序向用户　推荐商品。　２提出的改进算法　电子商务中可能包含数量巨大的商品．这使得　ＩｔｅｍＲａｎｋ在生成项目节点图的矩阵　时耗时较长．导　致ＩｔｅｍＲａｎｋ不适合处理大规模数据　本文中．我们主　要是针对ＩｔｅｍＲａｎｋ算法的改进。首先我们用自构建聚　类（ｓｃｃ）算法［１８—１９］为用户分配类标签．其次用自构建聚　类（ＳＣＣ）算法对商品进行聚类以降低维度．然后创建项　目关联图．随后利用随机游走算法预测用户对项目聚　类评分．最后进行聚类转换到商品个体对用户进行推　荐商品。结果表明ＩｔｅｍＲａｎｋ的效率可以大大提高　２．１自构建聚类（ｓｃｃ）算法　假设　集合有ｎ个模式　，　，…，　，其中Ｘ　，…，　，１≤　≤ｎ，ＳＣＣ算法目的是将这些模式分配到　不同的聚类中。假设现在存在　个聚类，分别是Ｇ，，Ｇ　，　…，Ｇ　，每个聚类Ｇｆ（１≤暑，≤　）的平均值为ｍ，＝ｍ　ｍ）２，　…，　，标准差为ｏ－ｉ＝ｏ－￣１，ｏ－ｊ２，…，　，Ｇ７的大小为Ｓｊ，即Ｇ７　现代计算机　２０１７．０５中ｏ　研究与开发　含有的模式个数　最初我们没有聚类，Ｋ＝０，我们计算每　＝　个模式　对聚类Ｇ　的隶属度　（置），　Ｐ　．　．．　㈩　。　（ｘ　）＝ｎｅｘｐｌ一（　０＝１　Ｌ　ｕ』ｑ　）　｛，１　≤　Ｊ　（３）　因此我们有　个特征模式Ｘ。，Ｘ　，…，Ｘ　，每个具　有　个分量。设ｙ＝｛　Ｉ　１≤ｉ≤　。　如果隶属度不小于预定义的阈值，　。（Ｘ　）≥ｐ，　０≤ｐ≤１，我们就说　通过了聚类Ｇ，的相似度检测。较　大的Ｐ导致较小的聚类，较小的Ｐ导致较大的聚类。此　时可能有两种情况。一种情况为　没有通过对现存的　任何聚类Ｇ　的相似度检测。这种情况下我们创建一个　新聚类Ｇ＾，ｈ＝Ｋ＋ｌ，ｍ＾　，Ｏｒｈ－￣－ＯｒＯ，ＯｒＯ＝Ｏ＂ｏ，ｄｒｏ，…，ｏｒｏ是用户　定义的一个常数向量　此时聚类的数目增加了１，聚类　Ｇ　的大小初始化为１，即Ｋ＝ｈ，Ｓ１＝１。第二种情况置通　过了某些现存的聚类相似度检测，设最大隶属度的聚　类为Ｇ　此时把　归人到聚类Ｇ　中，更新聚类Ｇ　的均　值和标准差．这种情况下　不改变。该过程一直跌到所　有的模式被处理完，最终得到　个聚类。　２．２标记用户类标签　为了有效的降低维数，我们用ＳＣＣ算法对用户进　行聚类．标记用户类标签　而且不需要用户输入聚类个　数　为了消除用户评分的尺度不同，我们对用户评分进　行归一化：　Ｑ产∑　，＆＝ｌ　　１≤　≤Ⅳ，　（４）　，　１　≤　（５）　设　＝蕊１，　，…，　Ⅲ，１≤　≤Ⅳ，　＝｛　Ｉ　１≤　≤Ⅳｌ，我　们对　运用ＳＣＣ算法，假设得到ｚ个聚类，Ｇ。，Ｇ　，…，　Ｇ：，每个聚类当做一个类标签，分别标记为Ｃ　，Ｃ。，…，Ｃ：。　对所有属于聚类Ｇ．的用户我们标记类标签为ｃｊ。此时　我们将原始数据集合尺扩展为Ｒ　，（Ｒ　，Ｙ　），（Ｒ　，ｙ２），…　（Ｒ，ｖ，ｙＮ），ｙｉ∈｛Ｃｌ，Ｃ２，…，ｃ；｝，１≤ｉ≤Ⅳ。　２．３降维　这个步骤中我们使用Ｊｉａｎｇｆ　９】等提出的类似方法降　低商品维数。对于每件商品　，１　≤　，我们构造一个　特征模式ＸＦ－ｘｊ　，ｘｊ　，…，　，其中：　ｘｊ　Ｐ（ｃ　Ｉ　ＰＪ）＝一生　—一∑　，（１≤　≤ｚ，１　≤　）（６）　∑　现代计算机２０１７．０５中　然后我们在】，上应用ＳＣＣ算法，假设我们获得ｑ　个聚类Ｇ　，Ｇ：，…，Ｇ。，同一聚类中的商品相似。由于有ｑ　个聚类，用户对商品评价的维度由Ｍ降维到ｑ．得到矩　阵　：　ｔｌｌ　ｔ１２　ｔ２１　ｔ２２　ｉ　（８）　ｔＭｔ　（置）　（９）　然后我们把高维的ＮｘＭ矩阵Ｒ降维成低维矩阵　Ｂｌ　Ｂ２　Ｂ＝　：●　Ｒ　＝　（１０）　：　Ｂ　Ｂ　［６ｎ　ｂｉ２　６　）】，１≤　≤ｊ７ｖ　（１１）　我们将Ｂ中的每一列称为一个商品类．因此我们　有ｇ个商品类，记为ｇ　，ｇ２，…，ｇｑ。由此，原来具有　个　商品评分的用户记录降维成具有口个商品组评分。　ＩｔｅｍＲａｎｋ算法运行在　矩阵上，我们的算法将运行在　降维后的Ｂ矩阵上　２．４创建关联关系图　此步骤中我们创建一个相关图，显示ｑ个商品类　之间的关联关系。由于我们使用的是　，我们以不同的　方式派生关联关系图。每个商品类被视为一个节点，我　们有ｑ个节点。节点　和ｇＪ之间的权重为Ｗ　，１≤　√≤　ｑ．计算方式如下：　『０，ｉｆｉ＝ｊ　１∑Ｎ　（譬）　２　０，／ｆａｌ＝０　ＯＦ啦＝０　Ｚ　ｍ　（　）＝　ａｌ，ｆａｌ＜ｉｆ２　（１３）　啦　！，　ｏｔｈｅｒｗｉｓｅ　如果Ｗ　太大，则某些商品类可能占主导地位，并　且妨碍一些商品被划分到其他商品组，因此我们对１１３　设置上限为１。当关联关系图完成后，我们得到如下矩　阵：　３　实验结果与分析　３．１时间复杂度分析　在标记用户类标签步骤时．我们必须计算每个用　户和每个现有聚类之间的相似性．～为用户数．　为商　彬　＝　州　（１４）　品数．每个用户向量有　个分量．。为类标签个数，所　以这步骤复杂度为Ｏ（ＮｚＭ）　在降维步骤中．我们需要　计‘算特征模式和现有聚类之间的相似性．特征模式为　，然后我们对Ｗ矩阵的列进行归一化。　２．５随机游走　在随机游走步骤中．执行一系列随机游走。任一用　户１１，　，１≤　≤Ⅳ，设：　商品类为ｑ，每个特征模式包含ｚ个分量，所以这步　骤复杂度为Ｏ（Ｍｑ　）　在关联关系图步骤巾．两点之间　的权重Ｗｉｉ都需要汁算，所以这步骤复杂度为Ｄ（　）　在　ｖｉ（０）＝【（１ｌｑ　ｌｌｑ　１／ｑ）ｒ　然后执行如下步骤．直至Ｖｉ收敛　Ｖ　（￡＋１）＝ＯｄＷＶ。（￡）＋（１一　）Ｂ　，ｔ＝０，１，２，…　（１５）　随机游走算法中．公式（１６）必须要进行迭代．每次的跌　倒需要ｑｑ２次运算．对所有用户（Ⅳ个）的复杂度为０　（Ｎｑ　）。最后，对一个『｝】户来说，公式（１９）需要进行　次　（１６）　运算．每次涉及ｑ次乘法和ｑ一１次加法，所以此步复杂　度为Ｄ（帕Ｍ）。所以，总共的时间复杂度为Ｄ（　（Ｍｑｚ）＋０（ｑ２）＋（）（Ａ　）＋Ｄ（，ｖｑ　）。　其中　是根据公式（１４）得到的，　，是根据公式（１１）　得到的。假设　为收敛后的向量，则　是为用户Ｕ　生　成的推荐商品组　）＋（）　３．２实验结果分析　本文用了四个数据集进行实验．分别是Ｍｏｖｉｅ—　Ｌｅｎｓ．ＢｏｏｋＣｒｏＳＳｉｎｇ和Ｅｐｉｎｉｏｎｓ，这　个数据集的特征如　２．６再转换　在上面步骤中，我们得到ｑ个商品类。为朋户　推　荐的商品类包含ｑ个商品　但是．最终我们不是向用户　推荐商品类，而是向用户推荐单个商品．因此，我们要　将　。转化成包含单个商品列表的Ｓ　。根据公式（９），我　表ｌ所示　、通过与［ｔｅｍＲａｎｋ算法．ＰＲＭ２算法．ＢｉＦｕ算　法和ＩＣＲＲＳ算法进行比对　ＩｔｅｍＲａｎｋ算法不采Ｈ４任何　降维技术，ＰＲＭ２算法应用奇异值分解（ＳＶＤ）方法来降　们得到ｘｊ对商品聚类Ｇ。，Ｇ：，…，Ｇ　的隶属度分别为￡　（　），　（　），…，　（　）。首先我们对公式（８）　维，ＢｉＦｕ算法应用Ｋ—ｍｅａｎｓ算法进行聚类降维．ＩＣＣＲＳ　算法将评分估计的可信度与排名本身分离　一因为Ｋ—　ｍｅａｎｓ需要预先输入聚类数目．所以我们先运行本文的　方法得到聚类数目．然后把聚类输入应用到ＢｉＦｕ算法　巾的矩阵　的列进行归一化：　Ｍ　’　Ｑ　＝　ｔ　，Ｉ≤七≤ｑ　＝Ｉ　（１７）　（１８）　中。　表２　示了本文方法（ＩＲＳＣＣ）和ＢｉＦｕ中涉及的用　，ｌ　≤　户项目聚类数　表３显示了算法之间绝对平均误差　（ＭＡＥ）的比较。对ＭＡＥ来说，获得的值越小．方法越　对每一行进行如下计算：　ＳｉＩｌｌ＝ｔ，　Ｖ　１］＋ｔｒ．Ｖ　【２］＋　３Ｖ　【３１＋…＋　［ｑ】　（１９）　好。可以看出对于　个数据集来说．ＩｔｅｍＲａｎｋ和ＩＲＳＣＣ　在ＭＡＥ方面表现相当好　表４显示了不同方法之间的　执行时间（以秒为单位）的对比　我们可以看出ＩＲＳＣＣ　Ｓｉ们是Ｓ．的第　个分量，Ｖ　…是Ｖ。的第　个分量。　是商品ＰＪ对商品类　的贡献值，Ｖ　表示用户ｕ　对　商品类　的喜好程度。因此　，　】表示用户ｕ　在商品　类ｇｋ中对商品　的喜好程度，累加得出用户　对商品　Ｐｉ的喜好程度。最终，我们得到用户ｕ　的推荐商品列表　Ｓ…　运行速度要比其他方法好很多　表１数据特征　现代计算机　２０１７．０５中①　表２聚类数目　运行９ｌ２１．２９ｓ。相反，ＩＲＳＣＣ应用自构建聚类以降低维　度，把９８４６个商品聚类到５６个聚类中、所以在公式　（１６）中使用的关联关系矩阵减小到５６ｘ５６．所以ＩＲＳＣＣ　运行的很快。ＢｉＦｕ通过Ｋ—ｍｅａｎｓ进行降维．这是非常　耗时的．所以ＢｉＦｕ也比ＩＲＳＣＣ算法慢很多　表３不同方法的ＭＡＥ比较　为本算法选择一个合适的ｐ仍然是一个难题，还　是经受一些试验和错误　在第３节中指出Ｐ的选择直　接影响算法的效果　当Ｐ选择的较大时，聚类较小．生　成的聚类数日就较多．这将导致算法运行时间增加　表４不同方法执行时间比较　４　结语　在协同过滤系统巾．商品被视为特征．　然而．涉及　电子商务时．通常有相当多的商品．如果每一个商品在　推荐前都要考虑的话．推荐效率将是非常低效的　我们　提出了一种应用自构建聚类算法来降维．以达到效率　闪为ｈｅｍＲａｎｋ算法设计的维数是商品的数量．例　如．对于ＢｏｏｋＣｒｏｓｓｉｎｇ数据集来说ｌｔｅｍＲａｎｋ要处理一　个９８４６ｘ９８４６　阵．所以ＩｔｅｍＲａｎｋ在ＢｏｏｋＣｒｏｓｓｉｎｇ上　的提高。实验结果表明．推荐系统的效率大大提高，而　且不损害推荐质量　参考文献：　ｌ１　１Ｍａｒｋｏ　Ｂａｌａｌｍｎｏｖｉｅ，Ｙｏａｖ　Ｓｈｏｈａｍ．Ｃｏｎｔｅｎｔ－Ｂａｓｅｄ　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ．Ｃｏｍｍｕｎｉｃａｔｉｏｎｓ　ｏｆ　ｔｈｅ　ＡＣＭ．Ｍａｒｃｈ　１９９７．Ｐａｇｅｓ　６６－７２．　【２］Ｇａｔｚｉｏｕｒａ．Ａ．，Ｓｈｎｅｈｅｚ－Ｍａｒｒ￣，Ｍ．Ａ　Ｃａｓｅ—Ｂａｓｅｄ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ａｐｐｒｏａｃｈ　ｆｏｒ　Ｍａｒｋｅｔ　Ｂａｓｋｅｔ　Ｄａｔａ．ＩＥＥＥ　Ｉｎｔｅｌ１．Ｓｙｓｔ．３０（１），２０　１４．　Ｐａｇｅｓ２０—２７．　【３　ｌ　Ｒｉｓｈ．Ｉ．Ａｎ　Ｅｍｐｉｒｉ（‘ａｌ　Ｓｔｕ＜ｔｙ　ｏｆ　ｔｈｅ　Ｎａｉｖｅ　Ｂａｙｅｓ　Ｃｌａｓｓｉｆｉｅｒ．Ｉ　Ｉｎｔｅｒｎａｌｉｏｎａｌ　Ｊｏｉｎｔ　Ｃｏｎｆｅｒｅｎｃｅｓ　ｏｎ　Ａｒｔｉｉｆｃｉａｌ　Ｉｎｔｅｌｌｉｇｅｎｃｅ（ＩＪＣＡ１）Ｗｏｒｋ—　ｓｈｏｔ）ｏｎ　Ｅｍｔ）ｉｒｉｅａ１　Ｍｅｔｈｏｄｓ　ｉｎ　ＡＩ，ＰＰ．４１—４６．　【４１Ｃｕｉ，Ｈ．，ＺｈｔＩ，Ｍ．Ｃｏｌｌａｂｏｒａｔｉｏｎ　Ｆｉｌｔｅｒｉｎｇ　Ｒｅ（’ｏｍｍｅｎｄａｔｉｏｎ　Ｏｐｔｉｍｉｚａｔｉｏｎ　ｗｉｔｈ　Ｕｓｅｒ　Ｉｍｐｌｉｅｉｔ　Ｆｅｅｄｂａｔ‘ｋ．Ｊ．Ｃｏｍｐｕｔ．ｈｆｆ．Ｓｙｓｔ．１０（Ｉ４），　５８５５—５８６２．２０　ｌ　４．　１５１　Ｇｕｏ．Ｇ．．Ｚｈａｎｇ，Ｊ．，Ｔｈａｈｎａｎｎ，Ｄ．，Ｙｍ’ｋｅ－Ｓｍｉｔｈ，Ｎ．Ｌｅｖｅｒａｇｉｎｇ　Ｐｒｉｏｒ　Ｒａｔｉｎｇｓ　ｆｏｒ　Ｒｅｅｏｍｍｅｎｄｅｒ　Ｓｙｓｔｅｍｓ　ｉｎ　Ｅ—Ｃｏｍｍｅｒ（‘ｅ．Ｅｌｅｃｔｒｏｎ．　Ｃｍｍｎ．Ｒｅｓ．Ａｐｐ１．１３．４４０—４５５，２０１４．　【６１　Ｎｉｋｏｌａｋｏｐｏｕｌｏｓ，Ａ．Ｎ．，Ｋｏｕｎｅｌｉ．Ｍ．．Ｇａｒｏｆａｌａｋｉｓ，Ｊ．Ａ　Ｎｏｖｅｌ　Ｈｉｅｒａｒｃｈｉｃａｌ　Ａｐｐｒｏａｃｈ　ｔｏ　Ｒａｎｋｉｎｇ－Ｂａｓｅｄ　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｆｉｌｔｅｒｉｎｇ．Ｃｏｍ一　７１１１１１）．Ｃｏｍｐｕｔ．Ｉｎｆ．Ｓｅｉ．３８４。５０－５９．２０１３．　［７ｌ　Ｊｉａｎｇ，Ｍ．．Ｃｎｉ．Ｐ．，Ｌｉｕ．Ｒ．，Ｙａｎｇ，Ｑ．，Ｆｅｉ，Ｗ．，Ｚｈｕ，Ｓ．Ｙａｎｇ，Ｓｏｃｉａｌ　Ｃｏｎｔｅｘｔｕａｌ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ．Ｉｎ：２１ｓｔ　ＡＣＭ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒ—　ｅｌｌ（‘ｅ　ｏｎ　Ｉｎｆｉｍｎａｔｉｏｎ　ａｎｄ　Ｋｎｏｗｌｅｄｇｅ　Ｍａｎａｇｅｍｅｎｔ，ＰＰ．４５—５４．２０　１　２．　ｆ８１　Ｐｏｒｃｅｌ，Ｃ．．　ｒｅｊｅｄａ一｜Ａ）ｒｅｎｌｅ，Ａ．，Ｍａｆｌｉｎｅｚ，Ｍ．，Ｈｅｒｒｅｒａ－Ｖｉｅｄｍａ．Ｅ．Ａ　Ｈｙｂｒｉｄ　Ｒｅｃｏｍｍｅｎｄｅｒ　Ｓｙｓｔｅｍ　ｆｉ）ｒ　ｔｈｅ　Ｓｅｌｅｃｔｉｖｅ　Ｄｉｓｓｅｎｄｎａｔｉｏｎ　ｏｆ　Ｒｅｓｅａｒｃｈ　Ｒｅｓｏｕｒｃｅｓ　ｉｎ　ａ　Ｔｅｃｈｎｏｌｏｇｙ　Ｔｒａｎｓｆｅｌ－Ｏｆｆｉｅｅ．Ｉｎｆ．Ｓｃｉ．１８４．１一ｌ９．２０１２．　【９１Ｓａｒｗａｒ．Ｂ．Ｍ．．Ｋａｒｙｐｉｓ，Ｇ．．Ｋｏｎｓｔａｎ，Ｊ．，Ｒｉｅｄｌ，Ｊ．，Ｒｅｃｏｍｍｅｎｄｅｒ　Ｓｙｓｔｅｍｓ　ｆｏｒ　Ｌａｒｇｅ—Ｓｃａｌｅ　Ｅ—Ｃｏｍｍｅｒ（　Ｓｃａｌａｂｌｅ　Ｎｅｉｇｈｂｏｒｈｏｏｄ　Ｆｏｒｔｌａｔｉｒｏｎ　Ｕｓｉｎｇ　Ｃｌｕｓｔｅｒｉｎｇ．Ｉｎ：５ｔｈ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎ￣ｒｅｎｃｅ　ｏｎ　Ｃｏｍｐｕｔｅｒ　ａｎｄ　Ｉｎｆｏｒｎｍｔｉｏｎ　Ｔｅｃｈｎｏｌｏｇｙ．２００２．　【１　Ｏ］Ｂａ　Ｑ，Ｌｉ　Ｘ．Ｂａｉ　Ｚ．Ｃｌｕｓｔｅｒｉｎｇ　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｆｉｌｔｅｒｉｎｇ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｓｙｓｔｅｍ　Ｂａｓｅｄ　ｏｎ　ＳＶＤ　Ａｌｇｏｒｉｔｈｍ［Ｃ］．Ｓｏｆｔｗａｒｅ　Ｅｎｇｉｎｅｅｒｉｎｇ　ａｎｄ　Ｓｅｒｖｉｃｅ　Ｓｅｉｅｎｅｅ（ＩＣＳＥＳＳ）．２０　ｌ　３　４ｔｈ　ＩＥＥＥ　Ｉｎｔｅｒｎａｔｉｏｎａｌ　Ｃｏｎｆｅｒｅｎｅｅ　ｏｎ．ＩＥＥＥ，２０　１　３：９６３—９６７．　现代计算机２０１７．０５中　［１　１］Ｃａｉ　Ｙ，Ｌｅｕｎｇ　Ｈ，Ｌｉ　Ｑ，ｅｔ　ａ１．Ｔｙｐｉｃａｌｉｔｙ－Ｂａｓｅｄ　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｆｉｌｔｅｒｉｎｇ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｋｎｏｗｌｅｄｇｅ　ａｎｄ　Ｄａｔａ　Ｅｎｇｉｎｅｅｒｉｎｇ，２０１４，２６（３）：７６６－７７９．　ｆ１２］Ｓａｒｗａｔ　Ｍ，Ｌｅｖａｎｄｏｓｋｉ　Ｊ　Ｊ，Ｅｌｄａｗｙ　Ａ，ｅｔ　ａ１．ＬＡＲＳ＊：Ａｎ　Ｅｆｉｆｃｉｅｎｔ　ａｎｄ　Ｓｃａｌａｂｌｅ　Ｌｏｃａｔｉｏｎ—Ａｗａｒｅ　Ｒｅｃｏｍｍｅｎｄｅｒ　Ｓｙｓｔｅｍ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｋｎｏｗｌｅｄｇｅ　ａｎｄ　Ｄａｔａ　Ｅｎｇｉｎｅｅｒｉｎｇ，２０１４，２６（６）：１３８４－１３９９．　【１３］Ｑｉａｎ　Ｘ，Ｆｅｎｇ　Ｈ，Ｚｈａｏ　Ｇ，ｅｔ　ａ１．Ｐｅｒｓｏｎａｌｉｚｅｄ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ｃｏｍｂｉｎｉｎｇ　Ｕｓｅｒ　Ｉｎｔｅｒｅｓｔ　ａｎｄ　Ｓｏｃｉａｌ　Ｃｉｒｃｌｅ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｋｎｏｗｌｅｄｇｅ　ａｎｄ　Ｄａｔａ　Ｅｎｇｉｎｅｅｒｉｎｇ，２０１４，２６（７）：１７６３－１７７７．　［１４］Ａｌｌａｈｂａｋｈｓｈ　Ｍ，Ｉｇｎｊａｔｏｖｉｃ　Ａ．Ａｎ　Ｉｔｅｒａｔｉｖｅ　Ｍｅｔｈｏｄ　ｆｏｒ　Ｃａｌｃｕｌａｔｉｎｇ　Ｒｏｂｕｓｔ　Ｒａｔｉｎｇ　Ｓｃｏｒｅｓ［Ｊ］．ＩＥＥＥ　Ｔｒａｎｓａｃｔｉｏｎｓ　ｏｎ　Ｐａｒａｌｌｅｌ　ａｎｄ　Ｄｉｓ—　ｔｒｉｂｕｔｅｄ　Ｓｙｓｔｅｍｓ，２０１５，２６（２）：３４０—３５０．　【１５］Ｘｕｅ，Ｇ．一Ｒ．，Ｌｉｎ，Ｃ．，Ｙａｎｇ，Ｑ．，Ｘｉ，Ｗ．，Ｚｅｎｇ，Ｈ．－Ｊ．，Ｙｕ，Ｙ．，Ｃｈｅｎ，Ｚ．Ｓｃａｌａｂｌｅ　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｆｉｌｔｅｒｉｎｇ　Ｕｓｉｎｇ　Ｃｌｕｓｔｅｒ—Ｂａｓｅｄ　Ｓｍｏｏｔｈｉｎｇ．Ｉｎ：ＡＣＭ　ＳＩＧＩＲ　Ｃｏｎｆｅｒｅｎｃｅ，２００５．　【１６１范家兵，王鹏，周渭博，等．在推荐系统中利用时间因素的方法［Ｊ］．计算机应用，２０１５，３５（５）：１３２４—１３２７．　［１７］Ｐｕｃｃｉ，Ａ．，Ｇｏｒｉ，Ｍ．，Ｍａｇｇｉｎｉ，Ｍ．Ａ　Ｒａｎｄｏｍ－Ｗａｌｋ　Ｂａｓｅｄ　Ｓｃｏｒｉｎｇ　Ａｌｇｏｒｉｔｈｍ　Ａｐｐｌｉｅｄ　ｔｏ　Ｒｅｃｏｍｍｅｎｄｅｒ　Ｅｎｇｉｎｅｓ，Ｌｅｃｔｕｒｅ　Ｎｏｔｅｓ　ｉｎ　Ｃｏｍｐｕｔｅｒ　Ｓｃｉｅｎｃｅ—Ａｄｖａｎｃｅｓ　ｉｎ　Ｗｅｂ　Ｍｉｎｉｎｇ　ａｎｄ　Ｗｅｂ　Ｕｓａｇｅ　Ａｎａｌｙｓｉｓ　４８１　１（２００７）：１２７—１４６．　［１８］Ｌｅｅ，Ｓ．－Ｊ．，Ｏｕｙａｎｇ，Ｃ．－Ｓ．Ａ　Ｎｅｕｒｏ－Ｆｕｚｚｙ　Ｓｙｓｔｅｍ　Ｍｏｄｅｌｉｎｇ　ｗｉｔｈ　Ｓｅｌｆｃｏｎｓｔｒｕｃｔｉｎｇ　Ｒｕｌｅ　Ｇｅｎｅｒａｔｉｏｎ　ａｎｄ　Ｈｙｂｒｉｄ　ＳＶＤ—Ｂａｓｅｄ　Ｌｅａｒｎｉｎｇ．　ＩＥＥＥ　Ｔｒａｎｓ．Ｆｕｚｚｙ　Ｓｙｓｔ．１１（３），３４１—３５３，２００３．　【１９￣ｉａｎｇ，Ｊ．－ｙ．，Ｌｉｏｕ，Ｒ．－Ｊ．，Ｌｅｅ，Ｓ．－Ｊ．，２０１１．Ａ　Ｆｕｚｚｙ　Ｓｅｌｆ－Ｃｏｎｓｔｒｕｃｔｉｎｇ　Ｆｅａｔｕｒｅ　Ｃｌｕｓｔｅｒｉｎｇ　Ａｌｇｏｉｒｔｈｍ　ｏｒｆ　Ｔｅｘｔ　Ｃｌａｓｓｉｉｆｃａｔｉｏｎ．ＩＥＥＥ　Ｔｒａｎｓ．Ｋｎｏｗ１．Ｄａｔａ　Ｅｎｇ．２３（３），３３５—３４９．　作者简介：　王茜（１９７０一），女，重庆人，教授，研究方向为网络安全、电子商务、数据挖掘　王艳明（１９９０一），男，河北邯郸人，硕士，研究方向为数据挖掘　收稿日期：２０１７—０３—１４　修稿日期：２０１７—０５—１０　Ｉ　ｍｐｒｏｖｅｄ　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｆｉｌｔｅｒｉｎｇ　Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　Ａｌｇｏｒｉｔｈｍ　ＷＡＮＧ　Ｑｉａｎ，ＷＡＮＧ　Ｙａｎ－ｍｉｎｇ　（Ｃｏｌｌｅｇｅ　ｏｆ　Ｃｏｍｐｕｔｅｒ　Ｓｃｉｅｎｃｅ，Ｃｈｏｎｇｑｉｎｇ　Ｕｎｉｖｅｒｓｉｔｙ，Ｃｈｏｎｇｑｉｎｇ　４０００４４）　Ａｂｓｔｒａｃｔ：　Ｉｎ　ｃｏｌｌａｂｏｒａｔｉｖｅ　ｆｉｌｔｅｒｉｎｇ　ｒｅｃｏｍｍｅｎｄｅｒ　ｓｙｓｔｅｍｓ，ｐｒｏｄｕｃｔｓ　ａｒｅ　ｒｅｇａｒｄｅｄ　ａｓ　ｆｅａｔｕｒｅｓ　ａｎｄ　ｕｓｅｒｓ　ａｒｅ　ｒｅｑｕｅｓｔｅｄ　ｔｏ　ｐｒｏｖｉｄｅ　ｒａｔｉｎｇｓ　ｔｏ　ｔｈｅ　ｐｒｏｄ．　ｕｃｔｓ　ｔｈｅｙ　ｈａｖｅ　ｐｕｒｃｈａｓｅｄ．Ｂｙ　ｌｅａｒｎｉｎｇ　ｆｒｏｍ　ｔｈｅ　ｒａｔｉｎｇｓ，ｓｕｃｈ　ａ　ｒｅｃｏｍｍｅｎｄｅｒ　ｓｙｓｔｅｍ　ｃａｎ　ｒｅｃｏｍｍｅｎｄ　ｉｎｔｅｒｅｓｔｉｎｇ　ｐｒｏｄｕｃｔｓ　ｔｏ　ｕｓｅｒｓＨｏｗｅｖ．　．ｅｒ，ｔｈｅｒｅ　ａｒｅ　ｕｓｕａｌｌｙ　ｑｕｉｔｅ　ａ　ｌｏｔ　ｏｆ　ｐｒｏｄｕｃｔｓ　ｉｎｖｏｌｖｅｄ　ｉｎ　Ｅ—ｃｏｍｍｅｒｃｅ　ａｎｄ　ｉｔ　ｗｏｕｌｄ　ｂｅ　ｖｅｒｙ　ｉｎｅｆｉｃｉｆｅｎｔ　ｉｆ　ｅｖｅｒｙ　ｐｒｏｄｕｃｔ　ｎｅｅｄｓ　ｔｏ　ｂｅ　ｃｏｎｓｉｄ—　ｅｒｅｄ　ｂｅｆｏｒｅ　ｍａｋｉｎｇ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎｓ．Ｐｒｏｐｏｓｅｓ　ａｎ　ｉｍｐｒｏｖｅｄ　ａｐｐｒｏａｃｈ　ｂａｓｅｄ　ｈｅｍＲａｎｋ　ｗｈｉｃｈ　ａｐｐｌｉｅｓ　ａ　ｓｅｌｆ—ｃｏｎｓｔｕｃｔｉｒｎｇ　ｃｌｕｓｔｅｒｉｎｇ　ａｌｇｏ．　ｒｉｔｈｍ　ｔｏ　ｒｅｄｕｃｅ　ｔｈｅ　ｄｉｍｅｎｓｉｏｎａｌｉｔｙ　ｒｅｌａｔｅｄ　ｔｏ　ｔｈｅ　ｎｕｍｂｅｒ　ｏｆ　ｐｒｏｄｕｃｔｓ，Ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　ｉｓ　ｔｈｅｎ　ｄｏｎｅ　ｗｉｔｈ　ｔｈｅ　ｃｌｕｓｔｅｒｓＦｉｎａ１１ｖ．ｒｅ—ｔｒａｎｓｆｏｒ—　．ｍａｒｉｏｎ　ｉｓ　ｐｅｒｆｏｒｍｅｄ　ａｎｄ　ａ　ｒａｎｋｅｄ　ｌｉｓｔ　ｏｆ　ｒｅｃｏｍｍｅｎｄｅｄ　ｐｒｏｄｕｃｔｓ　ｉｓ　ｏｆｆｅｒｅｄ　ｔｏ　ｅａｃｈ　ｕｓｅｒＷｉｔｈ　ｔｈｅ　ｐｒｏｐｏｓｅｄ　ａｐｐｒｏａｃｈ，ｔｈｅ　ｐｒｏｃｅｓｓｉｎｇ　ｔｉｍｅ　．ｆｏｒ　ｍａｋｉｎｇ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎｓ　ｉｓ　ｍｕｃｈ　ｒｅｄｕｃｅｄ．Ｅｘｐｅｒｉｍｅｎｔａｌ　ｒｅｓｕｌｔｓ　ｓｈｏｗ　ｔｈａｔ　ｔｈｅ　ｅｆｉｃｉｅｎｃｙ　ｏｆ　ｔｆｈｅ　ｒｅｃｏｍｍｅｎｄｅｒ　ｓｙｓｔｅｍ　ｃａｎ　ｂｅ　ｉｍｐｒｏｖｅｄ　ｗｉｔｈｏｕｔ　ｃｏｍｐｒｏｍｉｓｉｎｇ　ｔｈｅ　ｒｅｃｏｍｍｅｎｄａｔｉｏｎ　ｑｕａｌｉｔｙ．　Ｋｅｙｗｏｒｄｓ：　Ｃｏｌｌａｂｏｒａｔｉｖｅ　Ｆｉｌｔｅｒｉｎｇ　Ｒｅｃｏｍｍｅｎｄｅｒ　Ｓｙｓｔｅｍ；ｈｅｍＲａｎｋ　现代计算机　２０１７．０５中　

因篇幅问题不能全部显示，请点此查看更多更全内容

查看全文