参考文献20
1 绪论
1969年,美国国防部为了国家安全等目的建立了阿帕网(ARPA,互联网的前身)。在ARPA建立到现在的几十年间,互联网高速发展。如今,它已经融入人类日常生活中,在通讯,信息搜索,网络交易等各个方面给人们带来了极大的方便。互联网技术的迅猛发展使网络信息量不断膨胀,人们开始从信息匮乏的时代转入信息大爆炸时代。然而其中一些复杂的,一时间无法判断真假的信息使得用户难以找到自己真正感兴趣的东西。这种问题就称作互联网中的“信息过载”问题[1] 。为了有效解决这个问题,推荐系统[2]应运而生。论文网
推荐系统是根据用户的信息需求、兴趣等,将用户感兴趣的信息、产品等推荐给用户的系统。和搜索引擎相比推荐系统通过研究用户的兴趣偏好,进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。一个好的推荐系统不仅能为用户提供个性化的服务,还能和用户之间建立密切关系,让用户对推荐产生依赖。
推荐系统作为一种能有效帮助用户找到其感兴趣的信息的方法,在理论和实践上都取得了成功。但是随着用户的不断增加,推荐内容的扩大。传统的推荐方法很难在一个理想的时间内给用户一个满意的推荐方案。所以如何克服原有算法的这些问题,提升推荐的效率和推荐结果的精度是一个非常具有理论与实践意义的课题。
最近的迅猛发展,来源于web2。0技术的成熟。有了这个技术,用户不再是被动的网页浏览者,而是成为主动参与者[3]。在一个实际的推荐系统中需要推荐的产品可能会有成千上万,甚至超过百万,例如Amazon,eBay,Youtube等,用户的数目也会非常巨大。准确、高效的推荐系统可以挖掘用户潜在的消费倾向,为众多的用户提供个性化服务。在日趋激烈的竞争环境下,个性化推荐系统已经不仅仅是一种商业营销手段,更重要的是可以增进用户的黏着性。
据VentureBeat统计,Amazon的推荐系统为其提供了35%的商品销售额。尽管现有的推荐系统已经在电子商务等领域取得了巨大的成功,但是还需要在不同领域研究人员的努力下进一步完善和发展[4]。根据推荐算法的不同,推荐系统可以分为如下几类:协同过滤(col-laborative filtering)系统;基于内容(content-based)的推荐系统;混合(hybrid)推荐系统以及最近兴起的基于用户一产品二部图网络结构(network-based)的推荐系统。
本文会对推荐系统的组成,在这个数据膨胀时代主要存在的问题以及对于是否有效解决问题的评价指标做一个简单的介绍,并对以上的推荐系统做一个描述,然后使用矩阵完整化(Matrix Completion, MC)[3]的技术做一个电影推荐系统并进行研究。完成基于低秩矩阵完备模型的推荐算法。
2 推荐系统的组成
如今,推荐算法的应用研究大幅增加。各种推荐算法层出不穷。为了从复杂的数据中,为用户过滤掉无关的信息,而使其能够快捷的找到自己需要的相关内容,从而提升用户的满意度。许多研究者基于不同的研究方法和不一样的推荐目的,推出了很多种不同的推荐算法。这一章,我们将对这些不同推荐系统的总体框架进行一个概括。文献综述
虽然各种各样的推荐系统由于目的的不同,数据的构成结构不同,所采用的方法也不尽相同,对数据的依赖性的大小也不太一样。一些依赖于用户或者项目本身的特征表述;一部分则更加关注用户的行为以及社交活动;而还有的则只用到用户对项目的评分与评价。但是作为一个一般的推荐系统,其中的数据主要分为三类:用户,项目,依赖(用户数据和项目数据之间的关系)。