3.2 基于项目的协同过滤推荐算法(Item-Based CF) 15
3.3 基于用户的协同过滤推荐算法(User-Based CF) 16
3.4 协同过滤推荐算法面临的挑战 18
3.4.1 数据稀疏性 18
3.4.2 可扩展性 19
3.4.3 同义性 20
3.4.4 其他挑战 20
4 推荐算法对比实验 21
4.1 数据来源 21
4.2 实验方案设计 21
4.3 实验结果及分析 22
5 基于Apache Mahout的电影推荐引擎 27
5.1 开发环境 27
5.2 数据来源 27
5.3 数据建模 27
5.4 实现推荐引擎 29
5.5 推荐引擎 API 设计与实现 32
结 论 33
致 谢 34
参考文献35
1 绪论
1.1 课题研究背景及意义
互联网的快速发展,让“大世界”变成“小网络”。人们即使不出门,也能看到最新的新闻,买到刚上柜的商品。于是,电子商务在商品贸易这一领域实现蓬勃发展,并且随着电商的发展及其规模的扩大,商品种类和数量不断增长,消费者不得不花费更多的时间来挑选自己喜欢的商品。由于国内多家大型电商平台如淘宝、京东等近几年逐渐让网民形成了“shopping online”的消费习惯,电商环境已相当成熟,电子商务已进入高速发展的阶段。在这个信息过剩的电商时代,个性化推荐系统(Adomavicius et al, 2005, Resnick et al, 1997)对于互联网公司运营的重要性自不待言。在电商领域,哪家电子商务平台的个性化推荐做的好,哪家就更有竞争力。京东基于大数据和个性化推荐的算法,实现了“千人千面”的效果,在PC端和移动端已经为京东贡献了10%的订单。甚至有数据显示早期Amazon的推荐系统为其增加了35%的销售额[1]。
基于机器学习和海量数据挖掘,商品个性化推荐系统越来越智能化,在分析用户行为和用户心理的同时,能给消费者一个满意的结果。在满足消费者需求的同时,也兼顾生产者的利益,将信息以最高的效率传递给对其信息感兴趣的用户。个性化推荐系统具有主动性:在用户产生浏览、标记书签、购买等行为时,将用户历史行为信息收进库中,并且依据这些信息,给用户呈现一份推荐列表。而且,这个列表是能够即时更新的,即推荐列表会随系统商品集或用户特征集的变化而变化。这使电子商务活动更加简便且更有效,同时也使企业的服务质量与水平显著提高。
推荐系统之前一直处于实验室研究阶段,如今不仅众多的B2C网站将之应用于商品个性化推荐,百度、谷歌等搜索引擎也一直致力于个性化搜索引擎技术的开发,目前已经比较成熟,而且随着机器学习及人工智能研究的热门化,这一技术将更加成熟。它们凭借用户曾经的搜索记录来预测用户的兴趣口,以便在用户“search”后提供更符合用户需求的搜索反馈。2014年淘宝“双十一”交易额达到571亿,随着淘宝天猫取得的巨大成功,众多电子商务推荐系统不断出现,如逛丢——小时风云榜能将网上降幅最大的Top-N推荐列表生成。其中国际上相当著名的亚马逊商城,通过消费者的心愿单、购物车、已购买商品的评价以及历史购买记录等,预测符合用户喜好的商品,生成“为我推荐”列表,方便用户选择。Net Perceptions公司则提供基于GroupLens技术的推荐系统。国内的京东商城、当当、淘宝等也提供情感评价、等级评分、相关推荐等多种推荐方式,吸引了广大“剁手族”的目光,为其销售份额添上浓墨重彩的一笔。 面向电商平台的商品个性化推荐系统设计(2):http://www.751com.cn/jisuanji/lunwen_21338.html