兰州大学信息科学与工程学院———————————————作者简介:刘起东(1990-),男(汉族),河南省新乡市人,硕士,主要研究方向为个性化推荐、社交网络、数据挖掘以及大数据等等,wliuqidong@126.com.协同过滤:相似度在SlopeOne算法的作用*刘起东1(1.信息科学&工程学院兰州大学,兰州市730000)摘要:SlopeOne是一种Item-based的协同过滤算法。作为一个最近提出的算法,SlopeOne算法有许多优点,比如简单、易扩展、计算复杂度低等。尽管SlopeOne算法广泛应用到大数据中,但是SlopeOne算法在精确度方面并不是太理想,因为SlopeOne算法没有考虑用户的相似度。在本文我们通过在MovieLen数据集上的实验分析出SlopeOne算法只适应于相似的群组里面,那些与当前用户拥有不同偏好的用户产生了很大的噪声。基于我们的发现,我们提出了一种新的加权SlopeOne算法,并在最后的实验中证明了我们算法的精确性。关键词:协同过滤;推荐系统;SlopeOne算法;相似度中图分类号:****文献标志码:A文章编号:(作者可不填)doi:10.3969/j.issn.1001-3695(作者可不填)CollaborativeFiltering:SimilarityinSlopeOneAlgorithmLIUQi-dong1(1.Schoolofinformationscience&engineering,LanZhouUniversity,LanZhou730000,China)Abstract:SlopeOnealgorithmwaskindofitem-basedcollaborativefiltering.Asarecentproposedalgorithm,SlopeOnehaveseveraldesirablepropertiessuchassimple,beingupdatableonthefly,efficienttocompute.EventhoughtheSlopeOnealgorithmwaswidelyusedonlargedatasets,itperformsnotsowellintermsofaccuracy.ThereasonisthattheSlopeOnealgorithmignoredaimportantfactor:similaritybetweenusers.UsingMovieLensdata,wefindthattheSlopeOnealgorithmisonlyapplicabletosimilarusergroups,thenoisewhichtheusershavetheoppositeprofileleadstothelowaccuracy.Basedonourfindings,weproposedanimprovedweightedSlopeOnealgorithmwhichmoreaccuracy.Intheend,theresultsoftheexperimentsonMovieLensdatasetsconfirmedtheeffectivenessofourmethods.Keywords:collaborativefiltering;recommendersystem;slopeone;similarity0引言随着互联网的快速发展,数据呈现爆炸式增长。信息超载问题使的用户无法从中获取对自己有用的部分。如何从海量的大数据中挖掘出有用信息变得越来越重要。推荐系统利用数据挖掘或者信息过滤技术为用户提供个性化信息、商品和服务推...