2.2 协同过滤算法概况 4
2.3 常见协同过滤算法 6
2.4 本章小结 6
3 课题分析 7
3.1 需求分析 7
3.2 数据集分析 7
3.2.1 数据集信息 7
3.2.2 数据集处理 8
3.2.3 过滤数据集分析 8
3.3 本章小结 10
4 推荐系统设计 11
4.1 评分函数 11
4.2 基于用户的协同过滤算法 11
4.3 基于游戏的协同过滤算法 14
4.4 融合算法模型 16
4.5 本章小结 16
5 实验结果分析与参数调整 17
5.1 最近邻算法结果分析与参数调整 17
5.1.1 欧几里得算法 17
5.1.2 皮尔逊相关系数 18
5.1.3 Cosine余弦相似度 18
5.1.4 Tanimoto系数 19
5.2 融合算法结果分析与参数调整 19
5.3 本章小结 20
结 论 21
致 谢 22
参考文献 23
附录 24
1 绪论
1.1 研究背景与意义
伴随着Internet技术与电子科技技术的发展,网络上的信息量大幅度增加,人们对网络资源的依赖越来越大。其中,在二十一世纪,智能手机的诞生,尤其是在苹果手机IPhone4的出现后,人们对智能手机的依赖越来越大。手机资源在网络方便变得越来越丰富。人们通过手机,可以下载到很多的手机游戏,来丰富自己平时的闲暇生活。海量的手机游戏,也让手机游戏的开发商和发行商们看到了未来的市场。越来越丰富并且炙手的手机游戏不断地涌现,比如现在手机单机游戏《开心消消乐》、手机网游《Dota传奇》。而在这些手机游戏中,则存在了多种方式获得盈利。在这些游戏中,可以采取游戏计费,道具计费,广告收费等多种游戏利润。用户在玩游戏的同时,都是无形中为游戏的开发商,发行商提供收费机会。对于用户,挖掘其可能其自身行为和支付行为,并通过预测的用户行为,为其推荐相似并且用户会采取付费行为的游戏,成为所有互联网商家所致力于研究发现的。本文,将致力于这点,针对所给真实数据集,开发一套推荐系统,并进行探讨与改进。
1.2 国内外研究现状
从二十世纪九十年代互联网开始发展起来,推荐系统的研究与应用开始变得快速发展。社交网络,电子商务,智能手机市场的蓬勃发展促使了各个互联网公司、电子商务网站都推出了不同且效果不错的推荐系统。Twitter公司为其社交网络推出了Who to Follow算法[10],根据用户之间相同兴趣,联系和其他影响因子来构造百万用户之间的连接。Amazon公司推出了item-to-item的协同过滤和Top-N算法[11],为用户进行推荐相似产品。新浪微博在微博推荐中,提出了Graph-based推荐算法,LFM等推荐算法。在当下,成熟的推荐系统基本上都是采用的混合推荐算法。伴随着分析物品的复杂性,协同过滤推荐算法被提出来,并且协同过滤算法的优越性也得到体现,能够不用分析物品之间,单纯分析用户与物品之间的打分值,就可以进行推荐。然而,其缺点[1]也在数据量变大的情况下凸显出来,伴随着数据量变得庞大时,协同过滤算法会展现出精度下降、数据稀疏、冷启动问题和扩展性差。 手机游戏推荐技术研究(2):http://www.youerw.com/jisuanji/lunwen_22796.html