1.3 本文主要内容及结构安排
本文主要介绍了协同过滤算法,并针对不同类型的协同过滤算法和不同的最近邻算法,进行了概述与总结,并且分析本课题所使用的数据集中存在的分析难度,以及针对其问题解决的方法,以及对算法进行的优化。
本文的主体结构是这样安排的。第一章,主要概述了目前推荐系统的研究背景以及目前市场对推荐系统的研究情况。第二章,介绍了目前常见的推荐算法,以及常见协同过滤算法类型以及算法概述。第三章,说明了本课题研究的手机游戏数据集的分析及存在的困难点和对应的解决方法。第四章,则详细地讲述该推荐系统的设计,所采用的算法描述。第五章,针对项的评分表所表现的一些矩阵稀疏问题,在算法上面做出的降文改进和融合各种算法模型的方法。最后部分主要是本文所设计的推荐系统的描述和研究结论,参考文献以及对导师,师兄们的感谢。
2 协同过滤推荐技术概述
2.1 常见推荐技术
推荐系统是社交网站,电子商务网站等通过收集用户行为信息,对于用户分析其兴趣和行为,为用户提供推荐商品或者好友的分析系统。
1) 基于内容的推荐
基于内容的系统通过分析用户对商品资源或者好友列表给出的评分,之后通过分析商品资源或者好友列表的特征,寻找与该资源特征相似的商品或者好友,并将其推荐给用户。该推荐的理论依据是建立于信息检索和信息过滤。通过信息检索分析用户的兴趣、爱好等特征。之后根据用户和资源(商品或好友)的一个相似度,来寻找与资源相似度较高的商品或好友给用户。其用户的资料模型取决于其学习过程,例如决策树、神经网络和基于向量的表示等。基于内容的推荐算法的缺点在于要求资源能够提取出可比较、可分析的特征,如果要求推荐不同的商品,需要不同的商品之间可以提取出相似的特征,以分析相似度。举一个例子来说明基于内容的推荐,A用户如果购买了Java的书籍,那么也有可能购买安卓的书籍,因为安卓的书籍和Java的书籍很相似。
2) 基于规则的推荐
基于规则的推荐算法,则在于根据已有的资源,通过分析资源的特征相关度,根据资源之间的关联度,分析出关联度最高的物品,并推荐给用户。举一个例子,对于用户而言,买了面包的话,那么买牛奶的可能性,则非常高。基于规则的推荐的难点和缺点,在于需要耗时去训练和分析物品与物品之间的关联度,而且物品之间的内容相似度可能会相差很大,所以需要有大的训练集,来分析物品的内容关联度。
3) 基于协同过滤的推荐
协同过滤算法是可以推荐任一款东西,包括商品、好友等。协同过滤算法通过对评分项来进行预测。之后通过以评分项为单位的向量,分析用户与用户(或者项与项)之间的相似度。将相似度高的一些用户(或者项)即经典的Top-N算法或者阈值选择法推荐给用户。
4) 组合推荐
组合推荐算法,也是推荐系统中经常采用的方法。因为各个算法都存在着缺点和优点,所以,结合各个算法的优点和缺点,将预测结果按照某种方法,进行结果上面的结合。
结合的方法可能有以下思路:
a) 加权:加权多种推荐技术结果;
b) 变换:根据问题背景和实际情况或要求来决定变换采用不同的推荐技术;
c) 混合:结合多种推荐技术的推荐结果给用户;
d) 特征组合:组合来自不同推荐数据源的特征被另一种推荐算法来采用; 手机游戏推荐技术研究(3):http://www.751com.cn/jisuanji/lunwen_22796.html