第34卷第2期 计算机应用研究 Vo1.34 No.2 2017年2月 Application Research of Computers Feb.2017 基于评论与评分的协同过滤算法 李伟霖,王成良,文俊浩 (重庆大学软件学院,重庆400044) 摘 要:针对传统协同过滤算法中存在的数据稀疏性问题,结合用户评分及用户评论信息的特点,提出了基于 评论与评分的user.based协同过滤算法和基于评论与评分的item-based协同过滤算法。该算法利用主题模型产 生评论主题分布,利用评分数据生成评论态度影响因子,并通过评论态度影响因子来放大评论主题分布中的突 出特征,建立更为准确的用户偏好与物品特征,进而进行评分预测与物品推荐。实验结果表明,该算法在稀疏数 据集上可以获得较好的推荐效果,提高了推荐质量。 关键词:协同过滤;数据稀疏性;评论分析;主题模型;用户偏好 中图分类号:TP301.6 文献标志码:A 文章编号:1001・3695(2017)02・0361-04 doi:10.3969/j.issn.1001-3695.2017.02.009 Collaborative filtering recommendation algorithm based on reviews and ratings Li Weilin,Wang Chengliang,Wen Junbao (School ofSotfware Engineering,Chongqing University,Chongqing 400044,China) Abstract:In order to overcome the sparsity problem of traditional collaborative filtering algorithm,combining the characteris— tics of user ratings with user reviews,this paper proposed user-based collaborative filtering with reviews and ratings,and item— based collaborative filtering with reviews and ratings.The algorithms utilized topic model to generate review topics distirbution, and utilized ratings to generate review attitude.Then it used the review attitude to magnify the prominent aspects of review to- pics distribution,and finally predicted ratings and made recommendations.The experimental resuhs show that the proposed al— gorithms Can improve the quality of recommendation in sparse datasets. Key words:collaborative filtering;sparsity problem;review analysis;topic model;user preference 评分信息太少,所计算出的用户或物品相似度将难以保证准确 0 引言 性。 随着信息技术的飞速发展,信息过载问题日益突出,而推 近年来关于评论分析及文本挖掘的研究工作越来越受到 荐系统作为解决信息过载问题的有力工具,受到了越来越广泛 研究人员的关注。当用户在网上对某样商品给出评分的同时, 的关注与研究。推荐系统通过各种显式或隐式的信息资源,为 系统通常会需要用户再给出文字性的评论信息,用以解释用户 用户提供评分预测及商品服务推荐…。推荐算法是推荐系统 评分的依据。评论文本往往包含了丰富且有价值的信息资源, 的核心部分,不同的推荐算法利用了不同的信息资源及评分预 不仅可以帮助指导用户进行网络购物、网上订餐、查找电影或 测机制。当前,受到广泛研究的推荐算法主要包括协同过滤算 书籍等活动,同时也是商家获得用户反馈信息的一种有效途 法、基于内容的推荐算法、基于知识的推荐算法、混合推荐技 径 。通常,用户所给出的评论多是出于自己对物品的感性 术、基于计算智能的推荐技术、基于社会化网络的推荐算法、基 认知及主要印象,大部分用户不会针对物品各个方面给出详细 于上下文的推荐技术、群组推荐技术等 “J。其中,协同过滤 的理性描述,而仅仅是在评论中描述少数几个令他们印象深刻 算法是最为重要且最为成功的一种推荐技术,已被广泛运用于 的方面,但正是这少数几个方面的印象,在很大程度上决定了 许多在线应用中。 用户对物品的评分高低。换个角度来看,评分可以被看做是评 传统的协同过滤算法可分为基于用户的协同过滤(user- 论态度的数值化表示,用户给出的评分越高,其相应的评论通 based collaborative ifltering,UCF)和基于物品的协同过滤(item— 常带有积极的态度,而在那些评分较低的评论中,常常包含了 based collaborative ifltering,icr)。UCF算法使用用户一物品评 用户的消极情绪。图1展示了两条来自在线商店Amazon的商 分矩阵来计算用户相似性,为目标用户计算出最相似用户(最 品评分及评论数据。 近邻),进而为目标用户推荐其最相似用户所喜欢的物品或服 本文针对传统协同过滤算法的数据稀疏性问题,结合用户 务。而ICF算法同样是通过利用评分矩阵来计算物品相似性, 评论、评分信息的特点,提出了基于评论与评分的user.based 进而进行评分预测 j。但由于传统的协同过滤算法过于依赖 协同过滤算法(user—based CF with reviews and ratings,UCFRR) 评分数据,一旦评分矩阵过于稀疏(数据稀疏性问题),可用的 和基于评论与评分的item—based协同过滤算法(item.based CF 收稿日期:2016一O1—18;修回日期:2016—02-25 基金项目:国家自然科学基金资助项目(61379158);重庆市科技计划项目基础与前沿研 究计划资助项目(cstc2014jcyjA40054) 作者简介:李伟霖(1990一),男,福建福州人,硕士研究生,主要研究方向为Web数据挖掘、个性化推荐(705053387@qq.corn);王成良(1964一), 男,教授,主要研究方向为Web技术研究与开发;文俊浩(1969.),男,教授,主要研究方向为服务计算与面向对象的软件工程. ・362・ 计算机应用研究 第34卷 with reviews and ratings,ICFRR)。UCFRR与ICFRR通过结合 数量,?v代表了一篇文档中的词数量。参数 与口是语料级参 数(corpus—leve1),在生成语料的过程中被采样一次;变量0是 文档级变量(document—leve1),每篇文档被采样一次;而变量。 和变量W分别代表主题与词,是词级变量(document—leve1),对 评论文本中的评论主题与评论态度(评分影响因子)更准确地 构建用户偏好及物品特征,然后利用用户偏好及物品特征信息 进行相似度计算,进而提高评分预测的准确性,作出更为合理 的物品推荐。 瑾k B0∞O5坶9C R1a 41§斟 £ 矗9k,J ̄A麓O ZXS0OV'I ̄4 cat ̄oty C0】蚤l蝴 l知 s R霸鹰脚咖:^茂N 5O0VT R越in辩5.0 Tl蚶e:om8|卸曲gPr ̄t! Co自呲 The∞脑喇 jsfantaslie.The co触 ten,霉蛭 栅晰3intothethen ̄l c蝴withthethe1id in辨b%.I. 嘲n砖ewpkeePSthe bcvc ̄¥e姒for嗍鞠mitres.rd∞co锄娃鼬 啦 product ̄eve ̄: cate窖0 :MP3P|ayers Product:Apple-dassk-Silver-Generatlon—MODEL Re ̄ewe ̄lo:AS93GXMX61NDR Reviewer辩ame:clnewizard Rating:1.0 俐e:;Podclas ̄chasbigprob}emwithtvOUtfuncdon Content The newiPoddasskhas abigproblemforallusersofthephotoandvide0funotions.You %nnot pho ̄, ̄deosor podcastsonyourw sctreen.∞youcannotchanse theTVoutfuncttonOntheiPodfrom0 协ON Ifyouwantto seeyourvideosfromthe ;Podonthe screen,thendonattm ̄ythe odd ̄sicuntilAWlIehasfixed蛳.临pro铋em 图1用户评论示例 1 相关工作 1.1 传统的协同过滤算法 协同过滤算法已被成功运用于许多推荐系统中,它通过利 用用户的历史评分数据来预测用户偏好并推荐物品 ’ 。在 协同过滤算法中,所有评分数据组成了一个m行n列的评分 矩阵 ,其中行对应于用户,列对应于物品。对于UCF算 法,用户U对物品i的预测评分计算如下: rea c“, ,=r一u+ ; c 其中:Ⅳ表示用户u的最近邻集合;rv表示用户 对物品,i i 的评分; 和r 分别表示用户U和用户口的平均评分;sim(u, ) 则代表了用户u和 之间的相似度。计算相似度的方法主要 有三种,分别是余弦相似度、改进的余弦相似度以及Pearson相 关系数。Pearson相关系数的计算方法如下: sim( (2) √∑t f(, 。 —ru)  ̄/∑£ I(,rv 一 ) 其中f表示物品集合。而在ICF算法中,用户u对物品i的预 测评分计算如下: 乞 tuSim( ,J) upred( ).、 ■ …f.…~历一 。", , … ‘ ) 其中:, 代表用户 评分过的物品集合;sim(i, )代表了物品i 与物品 问的相似度,使用改进的余弦相似度计算相似度为 sim㈨ 熹c4, √∑ Uid (r , 一r ) √∑ u(i,j √一 ) 其中u 表示同时对物品i与J给出评分的用户集合。传统协 同过滤方法实现简单并有效,因此得到了广泛的应用。 1.2 Latent Dirichlet allocation模型 Latent Dirichlet allocation(LDA) 是一种概率生成模型, 目的是通过聚类文档现的词来形成主题 。LDA将每一 篇文档d与一个 维主题分布0相联系,同时每一个主题j}有 相应的词分布 , 代表了文档中一个词属于主题k的概率。 如图2所示,LDA模型图分为三层, 代表了文档集中的文档 应于每篇文档中的每一个词被采样一次。使用LDA模型能够 有效地揭示一篇文档中所讨论的主题及其分布情况。 。 图2 LDA模型图 1.3相关研究工作 近年来,越来越多的研究工作致力于用户评论分析以及利 用评论内容进行物品推荐,有许多新颖的方法被提出。Ganu 等人 “ 提出了一种基于SVM多标签文本分类器,在该方法 中,每条评论文本中的每一个句子都被标注上对应的主题类别 与情感,一个句子所代表的主题类别可不唯一,但所属情感只 能有一个。在其所使用的餐厅数据集中,该方法事先设定了餐 厅主题类别词:f0od、service、price、ambience、anecdotes以及mis— cellaneous,并设置了四种情感主题词:positive、negative、neutral 和conflict。在设定好句子类别及情感后,结合手动注释及自 动句子分类的方式对训练集进行训练,最后通过评论生成文本 评分(text rating),并利用文本评分进行评分预测及物品推荐。 但在该方法中,需要人工注释大约3 400条句子的主题类别与 情感分类,不仅需耗费大量时间资源,而且难以扩展使用到其 他领域。 文献[12]提出了一种基于主题模型的协同过滤算法(TM・ CF)用于解决数据稀疏性问题,该算法将评论主题与UCF算法 相结合,利用ASUM(aspect and sentiment uniifcation mode1) 副 产生评论主题分布,然后通过评论主题分布计算用户偏好,获 得用户最重视特征信息并计算用户相似性,进而预测评分并作 出推荐。TMCF算法在一定程度上有效地缓解了数据稀疏性 问题,但在稍稠密的数据集上却表现不稳定。由于TMCF中用 户偏好的计算是通过评论主题分布的平均值得到的,使得用户 偏好分布趋向于平均化,无法突出用户真正关注的主题特征, 同时TMCF算法忽略了评分与评论之间的关系。 McAuley等人 通过结合latent—factor模型与LDA方法, 提出了HFT(hidden factors as topics)模型。在该方法中,每件 商品的所有评论集被定义为一个文档,利用LDA方法获得该 商品的评论主题分布,该主题分布解释了对应商品的特征分 布,再将评论主题分布与latent-factor模型相结合,建立评论主 题与评分维度之间的关系。与文献[14]的思路类似,文献 [15]同样利用LDA方法来处理评论数据,并基于评论主题分 布获得用户偏好与商品画像信息,最后利用回归模型建立评论 与评分的关系。但这两种方法默认将评论主题分布与潜在评 分维度视为一致并建立转换,缺乏较好的解释性与扩展性。 . 2基于评论与评分的协同过滤算法 由于前述数据稀疏性问题的存在,传统协同过滤算法的推 荐质量无法得到保证。用户评论文本往往包含了丰富且有价 值的信息,即便在用户评分数据稀少的情况下,简单的一条评 第2期 李伟霖,等:基于评论与评分的协同过滤算法 ・363・ 论文本也可提取出许多关于用户偏好及物品特征的信息。基 于此,本文通过挖掘评论文本所包含的主题分布信息,将评分 其中:r 表示物品i的平均评分,t 的取值为0~1。评论态度 越大,表明i的物品特征越受用户 喜欢,相应评论的主题 分布描述就越有可能体现物品i的突出特征。因此,这类特征 在物品整体特征的建立过程当中理应占有更大的权重。本文 影响因子作为评论态度,提出了UCFRR和ICFRR算法。 2.1 基于评论与评分的user.based协同过滤算法 UCFRR算法将评论主题分布与user-based协同过滤算法 相结合,其流程如图3所示。 在UCFRR算法中,将每一条用户u对物品i的评论看做 一定义物品特征q 如下: qi: —— — Ly, 篇文档d ,使用LDA模型对评论进行处理,产生相应的K 是一个概率分布,指示了用户u在对物品 其中:吼:(g q ,…,q ); 代表所有对物品i给出过评论的 用户集合,D 表示物品i的评论集合,ID I=I I。定义物品 相似度如下: 维主题分布口 。 i的评论中所讨论主题的分布情况,可以用来指示用户的个人 偏好特点。同时,每条评论都有一个相应的评分r . 值越 sim(i,f):—:兰竺 (10) 高,表明物品i的特征越符合用户“的个人偏好,对应的评论 主题分布也更能反映用户u的偏好特点,评论态度往往也越积 极。因此,这类评论所产生的评论主题分布更具有价值,在用 户偏好的计算中理应获得更多权重。评论态度f 定义如下: = 南 (5) 其中:r 表示用户u的平均评分,£ 的取值为0~1。本文定义 用户偏好P 如下: p =—— ㈤ LO 其中:p =(P P ,…,P );L表示用户“评论过的物品集合, D 表示用户 的评论集合,l D I=I, I。利用结合了评论态 度的用户偏好来计算用户相似性,如下所示: siar(n, )=—= 尘 竺== (7)  ̄/∑ :lp × ̄/∑ :l西 其中:p 和p 分别代表用户u与 在第 个主题上的偏好分 布。最后,利用式(1)来计算预测评分。 评论态度£ 通过用户评分得到,t . 越大,表明用户//,对物 品i越满意,其对应的评论主题分布 也越接近用户 的个 人兴趣偏好。通过放大该评论主题分布 在用户偏好计算 中所占有的权重,使用户的兴趣特征得以突出,从而使得用户 偏好的建立过程更为合理、准确。此外,即便是在评分数据稀 疏的情况下,同样可以依靠评论主题分布来建立用户偏好。 2.2基于评论与评分的item.based协同过滤算法 ICFRR算法将评论主题分布与item—based协同过滤算法 相结合,其流程如图4所示。 图3 ucFRR算法流程 图4[CFRR ̄I:法流程 在ICFRR算法中,同样将每一条评论视为一篇文档,并使 用LDA模型进行处理,得到相应的评论主题概率分布 从 物品的角度来看,口 代表了物品i从用户u得到的一个特征 分布描述,物品i所得到的所有评论信息可以用来描绘其整体 特征轮廓。利用物品的评分数据引入评论态度t : tui= ,南 (8) ∑ k;lg2 ∑ :1g 其中:g 和g 分别表示物品i和物品 在第m个主题上的特 征分布情况,最后,利用式(3)来计算预测评分。 推荐系统的主要目标在于个性化地为用户推荐其可能感 兴趣的物品,不同用户的偏好不同,不同物品的特征也不同。 通过使用评论态度f 来放大用户偏好中的兴趣偏好,放大物 品特征中的突出特征,一方面使得用户偏好、物品特征的主题 分布不会趋于平均化,另一方面能有效刻画出用户与物品特 点,进而实现为特定用户推荐其感兴趣的物品,提高推荐质量。 此外,评论态度的计算虽然依靠评分数据,但即使是在评分数 据稀疏的情况下,依然可利用评论文本生成的主题分布来建立 用户偏好及物品特征,有效缓解了数据稀疏性问题。 3实验 3.1实验数据集 本文实验所使用的数据集来源自文献[13]所提供的Ama— zon电子设备评论数据集。本文选取其中的六类产品数据集 进行实验,分别是Canister vacuum、Digital SLR、Laptops、MP3 player、Space heater以及Coffee machine,数据集中每条评论都 带有一个对应的评分。表I显示了这些数据集的一些基本 信息。 表1数据集信息 其中,用户平均评论数等于评论数除以用户数,数据集稀疏度 的计算公式如下: 稀疏度=评论数/(用户数X物品数) (11) 从表1可以看出,这六个数据集都非常稀疏,如果仅依靠 用户评分来进行物品推荐,推荐质量将无法得到保证。同时, 本文计算了用户平均评论数,表1中各数据集的顺序是按照用 户平均评论数大小来排列的,实验结果表明,这个值与推荐质 量的好坏有着较大关系。为了便于与后面的实验结果进行对 比,图5显示了用户平均评论数曲线。本文随机选择每个数据 集中的80%作为训练集,20%作为测试集。 3.2评价指标 本文采用平均绝对误差(mean absolute error,MAE)作为衡 ・364・ 计算机应用研究 第34卷 量实验结果的评价指标。MAE作为最为常用的评价指标之 一据集上的实验结果几乎都优于其他三种算法(除了在数据集 Laptops上的MAE值稍高于Slope One)。而UCFRR算法的实 验结果也要好于对比算法,在六个数据集上的MAE值都低于 ,通过计算预测评分与用户实际评分的偏差来度量推荐算法 的准确性,MAE越小,则准确度越高。MAE定义如下: MAE: 越 ItestsetI (12) TMCF,在四个数据集上的MAE值要低于Slope One。对比图5 可以发现,四个算法的MAE曲线随着数据集用户平均评论数 的上升,整体都呈现下降趋势。通过以上实验可以看出,UC. FRR与ICFRR算法在稀疏数据集上可获得较好的推荐质量。 其中testset代表测试集数据。 3.3实验结果及分析 为了验证UCFRR与ICFRR的算法质量,本文设计了两组 实验。在实验1中,通过设置不同的参数来分别获得UCFRR 与ICFRR在各种条件下的MAE值。而在实验2中,将利用其 他算法来进行对比分析。 3.3.1 UCFRR与ICFRR在不同参数下的实验结果比较 本文分别实验对比了UCFRR与ICFRR算法在不同主题 图5数据集的用户平均评论数 图6对比算法实验结果 窖 数K下的实验结果,发现当K=10时,UCFRR与ICFRR在各 个数据集上的平均MAE都为最小。表2显示了在不同邻居数 (NN)下UCFRR算法的实验结果(取K=lo)。 表2 UCFRR算法结果 数据集 NN:5 NN=10 NN=15 NN=20 NN:25 NN=30 NN=35平均值 1.272 1.058 0.94 1.099 1.047 1.071 1.115 1.149 4结束语 本文通过挖掘用户评论文本中所隐含的主题分布信息,结 合评分数据,提出了基于评论与评分的user—based协同过滤算 法UCFRR和基于评论与评分的item—based协同过滤算法Ic— FRR。UCFRR与ICFRR利用LDA模型产生评论主题分布,利 Coffee machine 1.382 Canister vacuum 1.149 0.992 Space heater MP3 player Lat ̄ops Digital SLR 1.303 1.185 0 928 0.933 0.929 0.934 0.972 1.016 0.955 0.942 0.959 1.043 用评分数据计算评论态度,通过结合评论态度与评论主题分 布,使得用户个人偏好中的兴趣特点以及物品特征中的代表性 特征得以突出体现,以此来建立更为准确的用户偏好及物品特 征。实验结果显示,UCFRR与ICFRR算法在评分数据稀疏的 情况下,依然可获得较好的推荐精度。在下一步的研究工作 1 156 0.968 1.077 0.891 0.856 0.863 0.906 0.892 0.953 0.886 0 829 0 g23 0 727 0.741 0.734 0.695 0.776 0 804 0.726 0 641 0.618 0.592 0.613 0.638 0.662 平均值 1.118 1.009 0 887 0.874 0.855 0.866 0.872 表3显示了ICFRR算法在不同主题数 下的实验结果。 表3 ICFRR算法结果 中,将尝试在本文算法的基础上,结合其他非评分信息或方法 (如引入信任度或物品元数据)来建立更为准确的用户偏好与 物品特征分布,进而提高推荐质量。 参考文献: [1]Babadilla J,Ortega F,Hernando A,et a1.Recommender systems survey[J].Knowledge-Based Systems,2013,46(1):109—132. [2]Su Xiaoyuan,Khoshgoftaar T M.A survey of collaborative filtering techniques[J].Advances in Artiifcial Intelligence,2009,2009 (12):421—445. [3]Sun Zhoubao,Hart Lixin,Huang Wenlim ̄g,et a1.Recommender sys・ 观察表2和3中的实验结果可以看出,UCFRR与ICFRR tems based on social networks[J].Journal of Systems&Software, 2015,99:109-119. 算法在数据集Coffee machine上的效果都不大好,而在数据集 Digital SLR上都取得了各自最小的平均MAE值。结合各个数 据集的用户平均评论数来看,随着数据集的用户平均评论数增 大。UCFRR与ICFRR算法的平均MAE整体呈下降趋势,这点 在实验2的曲线图中将有更为直观的体现。此外,ICFRR算法 在各个数据集上的整体性能表现要好于UCFRR算法,这是由 于在各个数据集上,物品数量都要少于用户数量,则相应的物 品平均评论数要大于用户平均评论数,这意味着相较于用户而 [4]Lu die,Wu Dianshuang,Mao Mingsong,et a1.Recommender system application developments:a survey[J].Decision Support Sys- tems,2015,74(C):12-32. [5]Chen Li,Chen Guanliang,Wang F.Recommender systems based on user reviews:the state of the art[J].User Modeling and User- Adapted Interaction,2015,25(2):99-154. [6]Resnick P,Iacovou N,Suchak M,et a1.GroupLens:an open arehi— tecture for collaborative iflteirng of netnews[C]//Pmc of ACM Con- ference on Computer Supported Cooperative Work.New York:ACM Press,1994:175—186. 言,物品往往带有更多的评论文本信息,使得物品特征的建立 过程更为精确可靠。 3.3.2 与其他算法的实验结果比较 [7]Linden G,Smith-B,York J.Amazon.conr recommendations:item—to— item collaborative filtering[J].IEEE Internet Computing,2003,7 (1):76-80. 本文使用文献[12]中的TMCF模型及Slope One 算法 进行对比实验。TMCF模型是基于主题模型的协同过滤方法, [8]Blei D M,Ng A Y Jordan M I.Latent Dirichlet allocation[J].dour・ nal of Machine Leaming Research,2003,3(4—5):993-1022. 文献[12]的研究结果表明,TMCF算法在稀疏数据集上能实现 比传统协同过滤算法更好的推荐效果。实验2的结果如图6 所示。 [9]Ganu G,Elhadad N,Marian A.Beyond the stars:improving rating predictions using review text content[C]//Proc of lntemational Workshop 0n Web&Databases.2009. (下转第412页) 从图6可以看出,ICFRR算法的整体效果最好,在六个数 ・412・ 计算机应用研究 第34卷 法搜索LSSVM参数的时间,单位为S。 表1不同核函数预测结果比较 他两模型的对应值;从TIME指标可看出,相对于GA和PSO 算法,FOA搜索最优参数所用时间较少,这说明FOA在寻优效 率方面优于其他两优化算法,能够正确找到混合核LSSVM的 全局最优参数。由此可见,基于FOA优化的混合核LSSVM是 一种有效的铁路货运量预测方法。由于结合了Poly核函数与 RBF核函数的优点,混合核LSSVM比两单一核LSSVM能更好 地揭示铁路货运量的复杂变化,通过FOA实现参数的全局最 优选择之后,使混合核LSSVM充分融人了铁路货运量的相关 信息,从而提高了LSSVM预测精度。 管 蜘 趣 4结束语 本文提出将FOA与混合核LSSVM相结合的铁路货运量 预测方法,混合核LSSVM用于构建铁路货运量预测模型,FOA 用于搜寻混合核LSSVM最优参数 对我国铁路货运量的实例 验证表明,FOA可以快速、准确地获得混合核LSSVM的全局最 优参数,基于FOA优化的混合核LSSVM在预测性能方面优于 各单一核LSSVM,为铁路货运量的短期预测提供了一种有效 方法。 参考文献: 年份 年份 [1]张飞涟,史峰.铁路客货运量预测的随机灰色系统模型[J].中南 大学学报:自然科学版,2005,36(1):158—162. 图1不同核函数预测值比较 图2不同算法预测值比较 表2不同算法预测结果比较 [2]昊华稳,王富章.基于最大Lyapunov指数的铁路货物运量预测研 究[J].铁道学报,2014,36(4):7-13. 、 [3]郭玉华,陈治亚,冯芬玲,等.基于经济周期的铁路货运量神经网 络预测研究c J].铁道学报,2010,32(5):1—6. [4]刘强,陆化普,王庆云,等.基于支持向量机的区域运量滚动预测 模型[J].哈尔滨工业大学学报,2011,43(2):138—143. [5]Suykens J A K,Vandevalle J.Least squares support vector machine classiifers【J].Neural Processing Letters,1999,9(3):293—300. [6]耿立艳,梁毅刚.基于灰色自适应粒子群LSSVM的铁路货运量预 测[J].西南交通大学学报,2012,47(1):l44・150. [7]赵连彬,苏成利.双核函数最小二乘支持向量机汽油干点软测量 建模[J].石油化工高等学校学报,2013,26(3):74—78. [8]邓浒楠,朱信山,张琼,等.基于多核最小二乘支持向量机的短期 公交客流预测[J].交通运输工程与信息学报,2012,10(2):84- 88.131, [9]李炜,章寅,赵小强.混合核函数稀疏LS—SVM软测量建模与应用 通过比较表2和图2可知,FOA优化的Mixed—LSSVM较 [J].控制工程,2012,19(1):81—85. [1O]Pan W T.A new fruit fly optimization algorithm:taking the financial distress model as an example[J].Knowledge-Based Systems, 2012.26(1):69.74. GA、PSO算法优化的Mixed—LSSVM具有更优的预测效果,其四 个预测性能评价标准以及最大、最小相对预测误差分别小于其 (上接第364页) standing rating dimensions with review text[C]//Proe of the 7th ACM Conference on Recommender Systems.New York:ACM Press,2013: [10]Ganu G,Marian A,Elhadad N.URSA:user review structure anlay・ sis:understanding online reviewing trends,TR 668[R].Piscataway: Rutgers University,2010. 165.172. [15]高神墙,余文拮,晁平复,等.基于评论分析的评分预测与推荐 [J].华东师范大学学报:自然科学版,2015(3):80—9O. [16]Lemire D,Maclachlan A.Slope one predictors for online rating—based collaborative filtering[C]//Proc of SIAM Data Mining Conference. 2005:1—5. [1 1]Ganu G,Kakodkar Y,Marian A.Improving the quality of predictions using textual information in online user reviews[J].Information Sys- toms,2013,38(1):l一15. [12]Xu Jingnan,Zheng Xiaolin,Ding Weifeng.Pesronalized recommen- dation based on reviews and ratings alleviating the sparsity problem of [17]Papagelis M,Plexousakis D,Kutsurs T.Alaleviating the sparsity problem of collaborative filtering using trust iferences[C]//Prnoc of the 3rd International Conference on Trust Management.Berlin: Springer-Verlag,2005:224—239. collaborative filtering[C]//Proc of the 9th IEEE International Con・ ference on E-business Engineering.Washington DC:1EEE Computer Society.2012:9—16. [13]J0 Y,Oh A H.Aspect and sentiment uniifcation model for online re. view analysis[C]//Proc of the 4th ACM International Conference on Web Search and Data Mining.New York:ACM Press.2011:815-824. [18]Dong Ruihai,O’Mahony M P,SchaM M,et a1.Combining similarity and sentiment in opinion mining for product recommendation[J]. Journal of Intelligent Information Systems,2016,46(2):285- 3】2 [14]McAuley J,Leskovec J.Hidden factors nda hidden topics:under-