1.2 音乐流派分类的现状
1.3 本文主要研究内容和结构安排
本文主要研究了基于支持向量机的音乐分类问题。从音乐特征的提取方法和支持向量机的基本原理来介绍音乐分类系统的实现。
音乐特征提取方面,从人耳的听觉特性入手,介绍了音乐的部分时域和频域特性。介绍音乐的短时分析技术与预处理的作用,并着重讲了梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)等一系列参数。最后介绍了用于表现音乐特征的高维特征向量的组成。
在支持向量机方面,从支持向量机(SVM)的理论基础统计学习理论(Statistical Learning Theory,SLT)说起。介绍了支持向量机的分类基础,为解决线性不可分和非线性问题分别引入的惩罚因子和核函数的作用,还列举了几种常用核函数的种类及其性能。
本文对音乐分类系统做了大量的仿真实验,并在第四、第五章给出了数据结构。本文各个章节主要内容如下:
第一章主要介绍了音乐检索、音乐分类的意义以及关于音乐分类的研究近况。
第二章详细介绍了人耳对声音的感知原理和部分用于描述音乐的音乐声学特征。
第三章介绍了支持向量机的相关知识,阐述了支持向量机的分类原理。
第四章详细介绍了音乐的时域和频域特征提取方法,着重讲解了MFCC的提取步骤。
第五章使用高维的特征向量对系统进行仿真,验证可行性。
第六章对全文进行总结,对音乐分类前景进行展望。