基于支持向量机（SVM）的音乐流派分类(2)

菜单

4.1.1 预加重 15

4.1.2分帧与加窗 16

4.2 特征参数的提取 17

4.2.1 MFCC的提取 17

4.2.2 短时平均过零率的提取 20

4.2.3 短时能量的提取 20

4.3 音乐特征向量的组成 21

5 试验与结果分析 22

5.1 数据集的来源 22

5.2 数据的处理与存储 22

5.3 libsvm软件包及操作简介 23

5.4 核函数选择及参数优化 24

5.5 分类功能的评估 24

6结论与展望 27

6.1 论文工作总结 27

6.2 未来工作展望 27

致谢 28

参考文献 29

1 绪论

1.1 研究的背景和意义

随着科技的发展，音乐的传播途径也在发生着改变^优尔!文`论^文'网www.youerw.com，从最初的唱片及磁带，到后来的CD光盘。传统的音乐总是以实物为载体。随着互联网技术的发展，音乐以数字格式记录和存储通过互联网流动传输。[ ]数字音乐作为新兴的音乐模式，数字音乐占整个音乐唱片业销售额份额也在逐步提升，2012年全球数字音乐市场规模为94.2亿美元。数字音乐已成为音乐产业发展的一个重要方向。数字音乐在给人们带来了极大的便利的同时，为方便人们从海量的音乐资源中检索出自己喜爱的音乐，对音乐资源进行分类就变得势在必行。

现在最为常用的访问数据库的方式是通过关键字进行检索，对关键字进行文本匹配。[ ]这种方式需要通过人工输入音乐信息的各种属性来进行文本标注，比如音乐名称、专辑名、演唱者等。传统的关键词搜索虽然目前已经可以达到很高的"智能"水平, 搜索结果在很大程度上可以帮助用户找到需要的信息，但这种检索方式并不理解用户需要的是什么，只是对关键字进行匹配。当你输入歌手名字时能得到很好的检索效果，而当你输入深情的音乐或伤感的音乐时，搜索结果并不能令你满意。因此基于内容的检索方式就这样的需求下逐步发展起来。

基于内容的检索方式能够避免这样的情况发生，即使连用户都不清楚究竟在找什么。例如音乐识别软件Shazam，Shazam对拥有的歌曲数据库中的每首歌曲提取数字指纹，当你听到一首好听的歌，却不知道歌名叫什么的时候。可以使用手机麦克风对正在播放的音乐进行采样，对客户端采集到的简短歌曲样本做同样的处理后，得到数字指纹后提交给服务器，在之前生成的指纹库查找匹配便能返回歌曲的具体信息。

基于内容的音乐检索能使音乐更容易查找，为达成这样的目标需要对音频信号的特征进行提取与分析。人们根据曲调、旋律和节奏等要素，将音乐划分为不同流派。由于人们通常倾向于喜欢某些流派的音乐，因此音乐的流派信息一直是音乐信息检索的重要组成部分。对音乐流派进行分类最初主要靠人工进行，虽然人工操作的方法取得过成功，但是面对海量的专辑和歌曲，人工分类工作工作量巨大且繁重，并且消耗大量的人力成本，金钱和时间。更为严重的是，人工标注的速度已经不能跟上网络中音乐资源飞快增长的速度。所以人们希望找到一种方法，能够让计算机自动识别不同音乐各自所属的类别，由计算机来完成准确的分类工作，使人摆脱这样繁琐的工作。