MIDI哼唱检索算法研究+文献综述(6)_毕业论文

毕业论文移动版

毕业论文 > 计算机论文 >

MIDI哼唱检索算法研究+文献综述(6)


2.4选择的工具
目前大多数高层语义的音乐特征研究都以MIDI音乐库作为素材。MIDI文件是一种描述语言,存放着各音轨所使用的乐器和播放内容,其音乐播放器用于解释并播放声音,本质上是一种基于特征的音乐格式,在分析音乐时,许多基本特征可以直接从文件中得到。
MIDI音乐文件主旋律存储在某一音轨上,而其他音轨作为伴奏出现,特别是在流行歌曲中经常出现[1]。主旋律对音乐信息检索(MIR)、音乐旋律匹配等应用起到重要作用,例如基于主旋律片段的音乐检索,哼唱检索系统的应用。MIDI音乐文件每条音轨包含着一些特征,特别是主旋律包含着许多重要特征,其中音轨的熵就可以作为判别主旋律音轨的重要特征,主旋律一般比伴奏蕴含更丰富的情感信息,即含有更多的信息量。         
关于MIDI文件主旋律的提取方法在一些文献中被提出,通过简单的启发式搜索提取主旋律;提取主旋律通过一些与主旋律有关的简单特征,实验得出音轨名称特征为提取主旋律的最有效特征。通过音轨特征值的贡献度来选取主旋律。
应用的特征是基于假设主旋律可能有的特征,这很大程度上依赖于创作MIDI文件时所加的标注,然而,有些假设在一般情况下并不适用,用到的音轨主音量等特征。为了克服这些问题,本文将提取基于音轨音符的特征量以及符合midi特征的信息熵一起组成midi音乐文件的特征向量。在此基础上使用随机森林的方法构造分类器,实现MIDI主旋律音轨的抽取。
MIDI文件分为单声道MIDI和多声道MIDI。对于多声道MIDI,一些学者尝试从中找出主旋律音轨,然后提取特征信息。但是由于音乐创作的随意性,想从多声道中自动提取主旋律信息是非常困难的,上述参考文献中的算法应用非常有限,效果也不理想。对于单声道MIDI,因为只有一个声道,我们可以直接把这个声道作为主旋律声道。对于哼唱检索系统,乐曲数据库必须包括正确的旋律特征。本课题使用台湾清华大学张智星教授开放的48首单声道MIDI音乐⋯作为我们音乐数据库。从中提取旋律特征的特征信息作为我们的特征库。本文采用芬兰Jyvaskyla大学的Tuomas Eerola和Petri Toiviainen的midi工具箱来提取乐曲库中midi文件的音高值和音长值。我们以处理单声道midi音乐文件“两只老虎"为例,提取音高值的过程如下:
nmat=readmidi(‘22.Mid’);
p--pitch(mat);
d=dur(nmat);
3基于MIDI格式的音乐检索
3.1MIDI音乐格式
MIDI格式音乐文件
MIDI文件是一种描述性的“音乐语言”,它将所要演奏的乐曲信息用字节进行描述。譬如在某一时刻,使用什么乐器,以什么音符开始,以什么音调结束,加以什么伴奏等等,也就是说MIDI文件本身并不包含波形数据,所以MIDI文件非常小巧。
MIDI要形成电脑音乐必须通过合成。早期的ISA声卡普遍使用的是FM合成,即“频率调变”。它运用声音振荡的原理对MIDI进行合成处理,由于技术本身的局限,效果很难令人满意。而的声卡大都采用的是波表合成了,它首先将各种真实乐器所能发出的所有声音(包括各个音域、声调)进行取样,存储为一个波表文件。在播放时,根据MIDI文件记录的乐曲信息向波表发出指令,从“表格”中逐一找出对应的声音信息,经过合成、加工后回放出来。由于它采用的是真实乐器的采样,所以效果自然要好于FM。一般波表的乐器声音信息都以44.1KHz、16Bit的精度录制,以达到最真实的回放效果。理论上,波表容量越大合成效果越好。根据取样文件放置位置和由专用微处理器或CPU来处理的不同,波表合成又常被分为软波表和硬波表。MIDI作曲和核配器系统核心部分是一个被称为序列器的软件。这个软件即可以装到个人电脑里,也可做MIDI代码,在一个专门的硬件里。序列器实际上是一个音乐词处理器(word processor),应用它可以记录、播放和编辑各种不同MIDI乐器演奏出的乐曲。序列器并不真正的记录声音,它只记录和播放MIDI信息,这些信息从MIDI乐器来的电脑信息,就像印在纸上的乐谱一样,它本身不能直接产生音乐,MIDI本身也不能产生音乐,但是它包含有如何产生音乐所需的所有指令。MIDI文件分为单声道MIDI和多声道MIDI。对于多声道MIDI,一些学者尝试从中找出主旋律音轨,然后提取特征信息。但是由于音乐创作的随意性,想从多声道中自动提取主旋律信息是非常困难的。 (责任编辑:qin)