基于Apriori算法的电影推荐
时间:2023-06-15 21:19 来源:毕业论文 作者:毕业论文 点击:次
摘 要互联网的迅速发展导致新增信息量呈爆发式增长,用户面临着严重的信息过载问题。个性化推荐系统开始应用到互联网服务中,电影推荐技术应运而生。好的电影推荐算法对于商家来说极具有研究价值。本文通过最经典的算法Apriori算法来进行电影推荐。Apriori算法只从数据集中频繁出现的商品中选取共同出现的商品组成频繁项集,避免了信息量指数级增长的问题。一旦找到频繁项集,生成关联规则就很容易了。本文由四章构成,第一章主要介绍背景,电影推荐的内容和意义;第二章介绍所用的算法以及原理;第三章将用一个实例来检验这个算法;最后总结算法的优缺点。89116 The rapid development of the Internet has led to the explosive growth of new information, the user is facing a serious problem of information overload。 Personalized recommendation system began to be applied to the Internet service。 Good movie recommendation algorithm is of great value for businesses。 In this paper, the most classic algorithm Apriori algorithm for film recommendation。 The Apriori algorithm only selects the frequent item set from the commodity which appears frequently in the data set, and avoids the problem of the exponential growth of the information quantity。 Once the frequent itemsets are found, it is easy to generate Association rules。 This paper consists of four chapters。 The first chapter mainly introduces the background, content and significance of movie recommendation; the second chapter introduces the algorithm and principle; the third chapter will use an example to test the algorithm; finally summarizes the advantages and disadvantages of the algorithm。 毕业论文关键词:亲和性分析; 频繁项集; 关联规则; Aprioro算法; 电影推荐; Keyword: affinity analysis; frequent itemsets; association rules; Aprioro algorithm; movie recommendation; 目 录 摘要2 目录3 1背景介绍-4 1。1什么是电影推荐--4 1。2电影推荐的主要内容和意义--4 1。3现有的电影源Y于U优I尔O论P文W网wwW.yOueRw.com 原文+QQ75201-8766 推荐方法-4 2方法的原理和要点----5 2。1 Apriori算法介绍-5 2。2 Apriori算法流程-5 3实例计算-6 3。1获取数据集---6 3。2用pandas加载数据---7 3。3用Apriori 算法实现--8 3。3。1找出频繁项集---8 3。3。2找出关联规则--10 3。3。3计算规则的置信度-11 3。3。4找出需要的规则----13 4总结-15 参考文献--16 致谢---16 1背景介绍 1。1什么是电影推荐 在视频网站发展伊始,视频推荐就应运而生。视频推荐根据当前热门视频及用户 的个性化数据,为用户提供个性化的视频推荐,从而增加用户黏度,提高网站流量,是各大视频网站极为重视的功能之一。对于在线电影提供商,在线影片推荐系统的推荐效率会直接影响公司的经济效益,同时对公司的发展产生重要的影响[6]。 1。2 电影推荐的主要内容和意义 我们都知道,互联网给我们生活带来了极大的便捷,互联网具有信息传输的开放性信息交流的双向性,以及信息覆盖的广泛性等特点。互联网是把双刃剑,正是因为这些特点导致网络中的信息量以指数形式在无限的扩展和增加,信息迷航过载和信息过载等问题日益严重,解决这些问题的关键在于转化信息需求,需要将互联网从被动接受浏览者的请求转化为主动感知浏览者,以实现网络系统对浏览者的主动信息服务。因此,推荐技术应运而生,渐渐成为众多学者以及网络用户所关心的核心技术,这一技术的实现会给人们提供满意的信息和服务。在电影推荐技术方面国外比较著名的有Jinni,IMDB,Criticker,Movielens等,而国内的推荐系统近几年也处于一个高速发展的时期,如淘宝京东商城等[12]。个性化推荐技术虽然发展的很快,但本身固有的问题却是一直都存在,如数据稀疏和冷启动问题,以及推荐精确性问题。系统中如果用户购买的物品总量或者评分的物品总量在网站物品总量中占极小的比例就会造成评价矩阵( 用户物品矩阵) 非常稀疏,使我们找到最近相邻用户集难度加大,使相似度计算耗费增加,这就是数据稀疏问题。当数据稀疏问题发展到极端之后在一定角度看就是冷启动问题了,冷启动问题是指新物品首次出现后未得到任何用户评价或者新用户进入系统后未对任何物品进行评价从而造成难以推荐和推荐精确度差的问题。正因为数据稀疏和冷启动问题尚未解决,因此在保证精确性的前提下,降低两者的影响成为当前个性化推荐的热门方向。 (责任编辑:qin) |