基于内容的音频检索音频分类研究现状_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

基于内容的音频检索音频分类研究现状

音乐风格分类的研究音乐风格反映了音乐作品的总体基本特征,是音乐欣赏、分析、研究的基础,计算机音乐风格的自动分析,对音乐作品的检索、分类和研究,有极大的理论意义和实用价值[6]。对一首音乐进行音乐流派分类,我们可以将音乐分段,判断各个片段的特征风格,最后结合每个小片段的结果,来得到最后整个音乐的风格。78605

经过多年的研究,在音乐流派分类计算机分析领域,已取得了许多明显的进展,Tzanetakis等以音频的底层特征为基础,对10个风格流派分类,分类精度为60%,从而开创了这一新的研究领域,Jiang、Kosina、Grimaldi和McKinney等人,针对数个作品风格流派,获得了70%到90%的分类精度[6]。

我们从上面知道,音乐的分类辨识研究正在如火如荼的进行中,并取得了非常多的成就,与此同时,也暴露出了几个问题:(1)分类精度不高;(2)分类运算时间较长;(3)音乐本身的切割就是一个难题,音乐分片之后势必会影响整首音乐的分类,那就导致了音乐流派分类一定程度上依赖于分片方式,具有了一定的随机性。所以,我们有必要对音乐流派分类做进一步的研究,寻找一个更加优秀的算法。论文网

2基于内容的特征提取

基于内容的音频检索,首先需要的就是音频分类,而到目前为止,适用于音频分类的方法有很多[2]。成果比较多的方法还是对音频的特征提取和分类。这类方法通常是提取了时域或者频域当中的音频信号特征,频域中的特征需要先进行傅里叶变换。举两个例子:Scheirer的研究团队使用了4Hz能量、过零率(ZeroCrossRate)、频谱质心(SpectralCentroid)来把音频分成语音和音乐两类[4];LieLu的研究团队使用了梅尔频率倒谱系数(MFCC)、过零率

(ZeroCrossRate)、频谱通量(SpectralFlux)和频谱质心(SpectralCentroid)等特征将音频数据划分成音乐、背景音乐、静音、纯语音和非纯语音5类[4]。这两个团队的实验成果都是非常优秀的,证明了机器学习算法在音频数据处理中的可行性。但是,依然有缺陷,为此,我们需要对音频特征提取和音乐分类做进一步的研究。

(责任编辑:qin)