4.1.1 预加重 15
4.1.2分帧与加窗 16
4.2 特征参数的提取 17
4.2.1 MFCC的提取 17
4.2.2 短时平均过零率的提取 20
4.2.3 短时能量的提取 20
4.3 音乐特征向量的组成 21
5 试验与结果分析 22
5.1 数据集的来源 22
5.2 数据的处理与存储 22
5.3 libsvm软件包及操作简介 23
5.4 核函数选择及参数优化 24
5.5 分类功能的评估 24
6结论与展望 27
6.1 论文工作总结 27
6.2 未来工作展望 27
致 谢 28
参考文献 29
1 绪论
1.1 研究的背景和意义
随着科技的发展,音乐的传播途径也在发生着改变^优尔!文`论^文'网www.youerw.com,从最初的唱片及磁带,到后来的CD光盘。传统的音乐总是以实物为载体。随着互联网技术的发展,音乐以数字格式记录和存储通过互联网流动传输。[ ]数字音乐作为新兴的音乐模式,数字音乐占整个音乐唱片业销售额份额也在逐步提升,2012年全球数字音乐市场规模为94.2亿美元。数字音乐已成为音乐产业发展的一个重要方向。数字音乐在给人们带来了极大的便利的同时,为方便人们从海量的音乐资源中检索出自己喜爱的音乐,对音乐资源进行分类就变得势在必行。
现在最为常用的访问数据库的方式是通过关键字进行检索,对关键字进行文本匹配。[ ]这种方式需要通过人工输入音乐信息的各种属性来进行文本标注,比如音乐名称、专辑名、演唱者等。传统的关键词搜索虽然目前已经可以达到很高的"智能"水平, 搜索结果在很大程度上可以帮助用户找到需要的信息,但这种检索方式并不理解用户需要的是什么,只是对关键字进行匹配。当你输入歌手名字时能得到很好的检索效果,而当你输入深情的音乐或伤感的音乐时,搜索结果并不能令你满意。因此基于内容的检索方式就这样的需求下逐步发展起来。
基于内容的检索方式能够避免这样的情况发生,即使连用户都不清楚究竟在找什么。例如音乐识别软件Shazam,Shazam对拥有的歌曲数据库中的每首歌曲提取数字指纹,当你听到一首好听的歌,却不知道歌名叫什么的时候。可以使用手机麦克风对正在播放的音乐进行采样,对客户端采集到的简短歌曲样本做同样的处理后,得到数字指纹后提交给服务器,在之前生成的指纹库查找匹配便能返回歌曲的具体信息。
基于内容的音乐检索能使音乐更容易查找,为达成这样的目标需要对音频信号的特征进行提取与分析。人们根据曲调、旋律和节奏等要素,将音乐划分为不同流派。由于人们通常倾向于喜欢某些流派的音乐,因此音乐的流派信息一直是音乐信息检索的重要组成部分。对音乐流派进行分类最初主要靠人工进行,虽然人工操作的方法取得过成功,但是面对海量的专辑和歌曲,人工分类工作工作量巨大且繁重,并且消耗大量的人力成本,金钱和时间。更为严重的是,人工标注的速度已经不能跟上网络中音乐资源飞快增长的速度。所以人们希望找到一种方法,能够让计算机自动识别不同音乐各自所属的类别,由计算机来完成准确的分类工作,使人摆脱这样繁琐的工作。