基于Apriori算法的电影推荐(2)
时间:2023-06-15 21:19 来源:毕业论文 作者:毕业论文 点击:次
1。3 现有的电影推荐方法 Jinni是通过电影的情节时长,发生地点以及所获奖项关键字等一系列参数进行搜索,一种功能比较完善的电影推荐系统。Movie Genome作为Jinni 所采用的检索工具,知名度也特别高,连Google TV也采用这个工具实现个性化检索。Jinni 的Movie Genome是根据用户的评论或者其他一些信息来获取确切的参数,然后去描述一部电影,其中包含2200种不同的参数,包括类型背景氛围等。Movie Genome包含的大量参数可将电影进行分类,然后探索出用户偏好以及用户之间的关联程度[12]。 IMDB是一种同时使用多种关键字对需求信息进行筛选,也就是多重检索的电影推荐方法。比如说,IMDB可以分别检索电影情节和标题摘要类型关键字,同时还具有高级搜索。高级搜索分为三种,一种是高级标题搜索,高级标题搜索可以将电影类型时代投票数评分等多重因素考虑在内进行搜索推荐。第二种是高级名称搜索,高级名称搜索可以根据影片中演员的性别、出生日期、名字以及身高等因素进行搜索。最后是协同重叠搜索,协同重叠搜索则可实现两项标题或两项名称同时检索[12]。 Criticker是一种很有特色的电影评分方式,它运用的是兴趣兼容指数进行用户偏好定位。用户首先建立自己的账户,然后对网站内的电影进行评分针对用户的电影评分,范围从1至10 ,系统的等级分是该用户所有的电影评分排序,Criticker会再对评分电影自动设置等级分,然后再由高到低分别给予等级分数。这种评分方式的结果会出现这样的一个结果,两个用户对同一部电影给予相同的分数,但是等级分却不一定相等。用户通过这种方式产生自己所评电影的等级库,而对任意两个用户来说,相同电影的等级分数的不同会产生差值,将所有差值平均便可得到两用户的TCI,当TCI指数小于等于3时说明两用户的兴趣度较相似,因此在推荐电影的时候,若TCI 大于3,则两用户之间可认为无共同兴趣度,双方的选择及偏好不会彼此影响[12]。 Movielens提供三种方式搜寻电影 第一种方法是标题搜索,这种搜索得到的电影不会考虑用户是否对其评分或是否对其有预测。第二种方法是类型搜索,通过电影的类型进行检索,类型搜索不会返回用户已经评分的电影或没有预测过的电影。 第三种方法是高级搜索,它帮助用户改善搜索条件,而且并非简单的标题搜索加上类型搜索 它的搜索拥有不同的方式,比如标题短语搜索日期限制搜索语言范围搜索等 通过高级搜索对前两种基本搜索方式的完善,用户可以基本实现模糊信息下的电影搜索[12]。来自优Q尔W论E文R网wWw.YouERw.com 加QQ75201.8766 RottenTomatoes是一种追踪所有的评论内容以及正面评价的比例的推荐方式。假如正面的评论超过60%以上,将会认为这部电影是不错的。若一部作品的正面评价低于60%,则该作品会被标示为稍差的。 电影评价分为T-MeterCritics和Top Critics,前者是大众和专业影评人员的综合评分,后者只是专业影评人员的评分[12]。 2方法的原理和要点 2。1 Apriori算法介绍 Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集[11]。该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法[7]。 (责任编辑:qin) |