3。2。 用pandas加载数据 7
3。3。 稀疏的矩阵格式 7
4。 Apriori算法的实现 7
4。1。 Apriori的迭代过程 8
4。2。 Apriori演算法的实施 9
4。3。 提取关联规则 11
5。 关联规则的应用 14
6。 总结 15
7。 致谢 15
参考文献 16
绪论
研究背景和意义
根据16年11月发布的《2016中国音乐产业发展报告》中的数据显示,在2015年间,中国音乐产业 的总产值突破了三千亿。已经超过了动漫、游戏等其他娱乐产业的总产值,成为了文化娱乐行业的新标杆。[1]同时,据统计,2015年间,数字音乐用户突破了五亿。然而,在用户数量与音乐产值不断上升的同时,数字音乐产值的占比却有所下降。数字音乐市场规模的增长速度也有大幅度的下降(2014年11。5%,2015年1。4%)。然而其他数据表明,数字音乐消费仍有着巨大的潜在消费市场。因此,针对数字音乐产业的发展现状,我们有必要对如何找出独立的歌曲之间的关联进行研究。并在此基础上通过交叉销售的方式,达到在数字音乐用户基数不变的情况下提升数字音乐的产值、稳定数字音乐市场规模的增长的目的。
随着互联网时代的不断发展,信息超载(Informations Overload)的问题日趋显著。数字音乐因为音乐数量庞大和用户需求模糊不明确两大特点成为了存在信息超载问题的典型领域。目前,数字音乐用户一般可以通过歌名、歌手名、歌曲风格等与歌曲信息相关的关键字在音乐数据库中检索歌曲。然而实际情况是大多数用户听歌是没有目的性的,同时又希望听到符合自己喜好的音乐,那么显然上述通过检索来获取喜欢的音乐的方法远远不能满足目前数字音乐用户的需求。用户需要的是快捷的获得符合自身喜好的歌曲的方式。音乐系统需要的是了解用户的喜好,有针对性的为用户提供其感兴趣的歌曲,满足用户的需求。因此目前亟需解决的问题是如何针对不同的用户,为其推荐一份符合其喜好的专属歌单。针对目前的需求和问题,个性化推荐无疑是当前情况下最合适的解决方式。个性化的歌曲推荐顾名思义就是针对每一类有相同喜好的用户群体,为其推荐符合其喜好的歌曲。源Q于W优H尔J论K文M网WwW.youeRw.com 原文+QQ75201.,8766
就目前音乐推荐现况而言,现在的音乐平台的音乐推荐方式大致有三种:朋友推荐,人工推荐,智能推荐。朋友推荐主要是音乐和社交的交叉领域的交叉研究,主要是基于社交属性的推荐。人工推荐是指由音乐编辑人员人工推荐歌单和电台的推荐方式。目前人工推荐在大多数音乐平台中,仍然占有着较大的比重。其中人工推荐有一个显而易见的瓶颈,音乐编辑人员由于职业的工作导向,只能设计出少量的大众化的歌单,并不能做到真正意义上的个性化推荐。在智能推荐中,目前的音乐智能推荐技术大致可以分为基于歌曲内容的算法、基于标签的算法以及基于流行度的算法,但这些算法中或多或少存在着一些弊端。在基于歌曲内容的推荐算法中,一个弊端就是同质化情况较为严重,也就是算法会因为一个用户常听某位歌手的歌而将同一个歌手的歌推荐给用户。在基于标签的算法中,一个常见的问题是工作量十分庞大,特别是在现在数字音乐日益增加的情况下,要给所有歌曲打上标签,就现有的技术而言,显然是很难实现的;基于流行度的算法是根据流行度来推荐物品的算法,缺点有需要标准化产品,不会推荐新物品,推荐列表变动不大等。