摘要近年来,随着互联网用户积累的数据越来越多,推荐系统技术的也在不停地进步,被用于越来越多的领域,更广得投入到商业应用中去。很多网站都加入了集体智慧和推荐系统功能。本文以电影推荐为切入点,介绍了常见的基于用户和基于物品的协同过滤算法,加以实现并进行了比较,同时还利用主动学习的方法对电影标签的标注工作进行了辅助。 60359
毕业论文关键词 推荐系统,集体智慧,协同过滤,电影推荐,主动学习
Title   The development of a personalization movie recommendation website base on active learning  Abstract In recent years, with the development of internet, more data was collected, recommendation technical got a big progress and more widely used among business field. More and more website import  collective intelligence and collaborative filtering. The passage was based movie recommendation, describe basic user collaborative filtering algorithm. What’s more, active learning method was used for label the movies. 
 Keywords: recommendation system,  collective intelligence, collaborative filtering, movie recommendation, active learning 

目次 

1 引言.  6 

1.1 推荐系统背景简介  6 

1.2 推荐系统的定义.  7 

1.3 推荐系统的发展.  7 

2.推荐系统研究内容和国内外研究现状  9 

2.1 推荐系统研究内容  9 

2.2 国外研究现状  10 

2.3 国内研究现状  12 

2.4  电影推荐领域应用情况.  12 

3. 推荐算法研究.  13 

3.1  利用用户行为数据  14 

3.2  利用用户标签数据    16 

3.3  利用上下文信息  .  16 

3.4  利用社交网络数据  17 

3.5  主动学习.  17 

4.推荐系统的评价问题..  18 

4.1  准确率和召回率.  18 

4.2  覆盖率..  21 

4.3  新颖度..  22 

5. 协同过滤算法  24 

5.1 基于用户的协同规律算法:  24 

5.1.1 基于用户的协同过滤算法.  24 

5.1.2 用户相似度计算的改进..  28 

5.2  基于物品的协同过滤算法  30 

5.2.1 基于物品的协同过滤算法.  30 

5.2.2 用户活跃度对物品相似度的影响.  33 

5.3 UserCF和 ItemCF 的综合比较  ..  35 

6. 设计架构..  38 

6.1 B/S 架构  38 

6.2 Python Django MVC 框架 .  39 

6.3 数据库的设计  41 

6.4  软件可拓展性、可维护性的考虑  代码风格  ..  43 

结论  44 

致谢  45 

参考文献.  46 
1  引言 1.1推荐系统背景简介 随着信息时代和互联网的发展,人民逐渐从信息匮乏时代走入了信息过载时代。在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:对于信息消费者,找到感兴趣的信息是一件非常困难的事情,对于信息生产者,让自己生产的信息脱颖而出,受到广大用户的关注,也是一件非常困难的事情。推荐系统就是解决这一矛盾的重要工具。推荐系统的任务就是联系用户和信息,一方面帮助用户发现对自己有价值的信息,另一方面让信息能够展现在对它感兴趣的用户面前,从而实现信息消费者和信息生产者的双赢[1]。  解决信息超载问题一个非常有潜力的办法是推荐系统,它是根据人们的信息需求、兴趣等,将人们感兴趣的信息、产品等推荐给人们的个性化信息推荐系统。和搜索引擎相比推荐系统通过研究人们的兴趣偏好,进行个性化计算,由系统发现人们的兴趣点,从而引导人们发现自己的信息需求。一个好的推荐系统不仅能为人们提供个性化的服务,还能和人们之间建立密切关系,让人们对推荐产生依赖。  推荐系统现已广泛应用于很多领域,其中最典型并具有良好的发展和应用前景的领域就是电子商务领域。同时学术界对推荐系统的研究热度一直很高,逐步形成了一门独立的学科。  电影推荐一直是个性化推荐重点重要应用,他能够帮助用户从浩瀚的视频库中找到令他们感兴趣的电影。该领域里最成功的公司是 Netflix,国内的豆瓣也是该领域的佼佼者。  主动学习算法的基本思想是通过部分带标记实例的信息,反复在大量未标记实例中选取最佳的实例进行标记,以获得较为精确的统计学习模型[3].   

上一篇:软件自动化测试管理系统设计
下一篇:基于人脸图像的简易数据统计

基于Apriori算法的电影推荐

基于PageRank算法的网络数据分析

基于神经网络的验证码识别算法

基于网络的通用试题库系...

python基于决策树算法的球赛预测

基于消费者个性特征的化...

基于网络的通用试题库系统的整体规划与设计

ASP.net+sqlserver企业设备管理系统设计与开发

老年2型糖尿病患者运动疗...

LiMn1-xFexPO4正极材料合成及充放电性能研究

新課改下小學语文洧效阅...

张洁小说《无字》中的女性意识

麦秸秆还田和沼液灌溉对...

安康汉江网讯

网络语言“XX体”研究

互联网教育”变革路径研究进展【7972字】

我国风险投资的发展现状问题及对策分析