2。1 用户
用户数据主要包括使用该应用的用户的信息集合,一些推荐系统会根据用户的信息之间的相似度对用户进行分类。然后形成一个特征用户群。还有一些推荐系统则会对依赖进行操作从而找到用户的特征值或特征向量。而怎样根据已有的用户数据结构得到该用户的特征并进行正确有效的分类是这些推荐系统的一个课题。在本文的电影推荐系统中,用户的特征是和用户对各种电影的评分有关的。根据用户对已有的评分进行基于低秩矩阵的完备化以找到各个用户的特征。
2。2 项目
项目数据是推荐系统的推荐目标。项目数据包含该项目的一些基本信息。结构复杂度和用户相似,并且根据推荐目标的不同以及应用的场景不同会有非常大的差别。而推荐系统的主要工作是对项目的数据信息做一个关联。简单来说就是对数据源进行信息挖掘并根据信息的相似度把相似的数据联系起来。若已知用户对一个项目感兴趣,推荐系统则可以基于之前所做的项目联系,将相似度最大的用户以前可能不了解的项目推荐给该用户。这种推荐系统的算法基于一个这样的假设:若用户对一个项目感兴趣,则用户对和这个项目最相似的项目也会感兴趣。在本文的推荐系统中,项目实体是电影。项目之间的联系主要还是采用低秩矩阵的完备化来进行操作。来-自~优+尔=论.文,网www.youerw.com +QQ752018766-
2。3 依赖
依赖即为用户对系统中项目的一种交互行为(也可以称作事务)。它包括用户是否提交项目的明确交互行为以及提交行为的具体信息。某些推荐系统即使用户未提交明确的交互行为,还是会通过具体算法得到一个透明的行为信息。为后面的推荐做铺垫。作为一般的推荐系统中相对用户与项目来说最重要,数据量最大,操作最频繁的数据源。依赖的信息结构的优劣程度将极大的影响推荐算法的优劣性。优秀的依赖能为推荐系统的操作节省很多的时间和空间,并且使代码更加简洁易懂。本文的电影推荐系统中,依赖是用户对电影的评分。操作形式是通过矩阵来进行操作的。