e) 层叠:在第一种推荐的算法基础上,在做第二种推荐算法进行更好的精确推荐;0
f) 特征扩充:采用多种推荐技术,将某种推荐算法的特征信息加入到另一种推荐技术中,结合起来进行推荐
g) 元级别:类似于特征扩充,区别在于将一种推荐技术的模型作为另一种推荐技术的输入
2.2 协同过滤算法概况
协同过滤算法在1992年被提出,最初的提出,是用来为Xerox公司用来筛选邮件系统错误!未找到引用源。。之后,很快便应用到电子商务网站,其中最经典的就是亚马逊的网络书店。Amazon的网络书 店,通过分析用户已经购买的行为,并借用其他用户的信息,来推荐给用户。
协同过滤算法结合用户对于项目的评价信息,利用相似性来寻找与用户兴趣偏好相似的Top-N用户集合,之后通过最近邻算法将分析出的用户,根据分析出的用户的相似兴趣偏好,推荐给用户。相对来说,协同过滤算法,并不是太受物品的特性影响,而是在于用户对于项的评分,所以,协同过滤推荐算法具有个性化推荐,能够为用户寻找到新的兴趣。
基于协同过滤的推荐算法的流程基本可以分为了三个步骤:
1) 收集用户信息和评分项
通常而言,我们会根据用户与商品之间的评分表,建立起一个用户×商品的二文矩阵表,矩阵的值代表着用户与商品之间的评分值。其值可以代表任何含义,可以是0或1表示用户对商品之间的是否喜欢。也可以是一个值,来表示用户与商品的喜好程度。所以,协同过滤,对于商品而言,并不需要去分析商品集的特征和关联规则。只依赖于用户-商品的评分表。
2) 寻找最近邻
因为评分表可以将每个用户对应商品的关系抽成一个向量。之后采用多种常用的最近邻算法,包括欧几里得距离[8]、皮尔逊相关系数[8]、余弦相似度[8]等。基于各种最近邻算法,分析各个用户(或者商品)之间的相似值,并根据相似度值,按照从大到小的顺序,选取前Top-N用户,也可以选择一个阈值,将相似度值大于该阈值的加入到最近邻集合中。
在计算最近邻,可以有以下方法,进行选择。 手机游戏推荐技术研究(4):http://www.youerw.com/jisuanji/lunwen_22796.html