基于关联规则的Hadoop平台商品推荐系统 (2)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

基于关联规则的Hadoop平台商品推荐系统 (2)


1.2 发展现状
关联规则[2]挖掘技术被广泛地应用到各个行业中,比如电子商务、金融业应用等行业。在电子商务领域中,推荐技术最为成熟的购物网站亚马逊通过商品推荐技术极大地方面了人们的购物,网站根据顾客的购买记录,运用关联规则等推荐算法,向顾客进行商品推荐,不仅提高了顾客的购物体验,同时也增加了网站的销售额。同时在金融业中,西方一些银行根据用户的数据信息,向用户推送适合的业务,取得了很好的效果。
在我国,也有很多的电子商务网站借助着关联规则挖掘技术为客户提供更好的商品推送,利用已有的客户浏览和购物信息,准确地推送商品,不仅仅提高了客户的满意度和回头率,也大大增加了他们的销售业绩。比如在电子商务网站淘宝中,根据顾客的购物车和浏览记录,可以向顾客提供他们可能感兴趣的同类产品或者可能有购买需求的产品,从而提高网站的销售量和顾客的购买欲望,实现商户和消费者之间的快速服务达成和商品成交。
推荐算法虽然最先被应用于电子商务中,但是随着推荐技术地发展,越来越多的行业也用到了推荐算法。但是,由于人们消费习惯和其他原因,目前大多数推荐算法的准确度还是比较低,所以推荐算法还是有很大的发展空间。
1.3 研究内容及意义
电子商务领域,经常采用基于以往客户的浏览购买记录,通过一些数学方法,推测出新用户的购买喜好和需求,进而向用户推荐商品。利用基于关联规则的推荐算法来发觉不同商品直接的相关性,以简洁的数学模型、海量的支撑数据来完成推荐结果的计算。 本项目旨在设计并实现一个基于关联规则的商品推荐系统,利用Hadoop平台的分布式数据和处理能力[3],对于海量数据进行快速处理分析,得到推荐结果。
 2  常用推荐技术
2.1 推荐系统相关技术
随着工业界对推荐算法的需求的增加,越来越多的算法从学术界走向了工业界,但是不同的应用场景需要不同的推荐算法,下面我们对基于关联规则的推荐算法、基于协同过滤的推荐算法、基于内容的推荐算法和基于知识的推荐算法进行了了解、学习和对比,阐述了最终选择基于关联规则推荐算法的原因。
2.1.1 基于关联规则的推荐算法
关联规则是形如X→Y的蕴涵式,其中, X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent或right-hand-side, RHS) [1]。关联规则有三个度量:支持度、提升度和置信度[2]。支持度表示在事务中关联规则发生的频繁程度;置信度表示在某一事件发生的同时另一事件发生的概率。比如炸鸡--->啤酒规则,其支持度为20%,表示20%的客户同时购买了炸鸡和啤酒,置信度为80%,表明在所有购买炸鸡的客户中,有80%的人也购买了啤酒。提升度反映在预测结果方面,规则比只是首先假设该结果会好多少,它是关于该规则工作情况的有效性度量。
2.1.2 基于协同过滤的推荐技术
协同过滤(Collaborative Filtering),简单来说是利用拥有相投兴趣或者共同经历的人们的数据来向这个群体的人进行推荐[5]。例如微博可以根据共同话题或者共同关注的人来向用户推荐好友或者广告。
其可细分为两种,一种是基于物品的,基于item的协同过滤,通过用户对不同item的评分来评测item之间的相似性,基于item之间的相似性做出推荐;另一种是基于用户的,基于user的协同过滤,通过不同用户对item的评分来评测用户之间的相似性,基于用户之间的相似性做出推荐。
2.1.3 基于内容的推荐技术
根据用户过去喜欢的产品(item),为用户推荐和他过去喜欢的产品相似的产品[6]。比如,一个推荐零食的系统可以依据某个用户之前喜欢的零食而为他推荐零食。 基于内容的推荐最早主要是应用在信息检索系统当中,所以很多信息检索及信息过滤里的方法都能用于基于内容的推荐中。 (责任编辑:qin)