MIDI哼唱检索算法研究+文献综述(6)

时间:2017-06-25 19:27 来源:毕业论文作者:毕业论文点击:次

2.4选择的工具
目前大多数高层语义的音乐特征研究都以MIDI音乐库作为素材。MIDI文件是一种描述语言，存放着各音轨所使用的乐器和播放内容，其音乐播放器用于解释并播放声音，本质上是一种基于特征的音乐格式，在分析音乐时，许多基本特征可以直接从文件中得到。
MIDI音乐文件主旋律存储在某一音轨上，而其他音轨作为伴奏出现，特别是在流行歌曲中经常出现[1]。主旋律对音乐信息检索（MIR）、音乐旋律匹配等应用起到重要作用，例如基于主旋律片段的音乐检索，哼唱检索系统的应用。MIDI音乐文件每条音轨包含着一些特征，特别是主旋律包含着许多重要特征，其中音轨的熵就可以作为判别主旋律音轨的重要特征，主旋律一般比伴奏蕴含更丰富的情感信息，即含有更多的信息量。
关于MIDI文件主旋律的提取方法在一些文献中被提出，通过简单的启发式搜索提取主旋律；提取主旋律通过一些与主旋律有关的简单特征，实验得出音轨名称特征为提取主旋律的最有效特征。通过音轨特征值的贡献度来选取主旋律。
应用的特征是基于假设主旋律可能有的特征，这很大程度上依赖于创作MIDI文件时所加的标注，然而，有些假设在一般情况下并不适用，用到的音轨主音量等特征。为了克服这些问题，本文将提取基于音轨音符的特征量以及符合midi特征的信息熵一起组成midi音乐文件的特征向量。在此基础上使用随机森林的方法构造分类器，实现MIDI主旋律音轨的抽取。
MIDI文件分为单声道MIDI和多声道MIDI。对于多声道MIDI，一些学者尝试从中找出主旋律音轨，然后提取特征信息。但是由于音乐创作的随意性，想从多声道中自动提取主旋律信息是非常困难的，上述参考文献中的算法应用非常有限，效果也不理想。对于单声道MIDI，因为只有一个声道，我们可以直接把这个声道作为主旋律声道。对于哼唱检索系统，乐曲数据库必须包括正确的旋律特征。本课题使用台湾清华大学张智星教授开放的48首单声道MIDI音乐⋯作为我们音乐数据库。从中提取旋律特征的特征信息作为我们的特征库。本文采用芬兰Jyvaskyla大学的Tuomas Eerola和Petri Toiviainen的midi工具箱来提取乐曲库中midi文件的音高值和音长值。我们以处理单声道midi音乐文件“两只老虎"为例，提取音高值的过程如下：
nmat=readmidi(‘22．Mid’)；
p--pitch(mat)；
d=dur(nmat)；
3基于MIDI格式的音乐检索
3.1MIDI音乐格式
MIDI格式音乐文件
MIDI文件是一种描述性的“音乐语言”，它将所要演奏的乐曲信息用字节进行描述。譬如在某一时刻，使用什么乐器，以什么音符开始，以什么音调结束，加以什么伴奏等等，也就是说MIDI文件本身并不包含波形数据，所以MIDI文件非常小巧。
MIDI要形成电脑音乐必须通过合成。早期的ISA声卡普遍使用的是FM合成，即“频率调变”。它运用声音振荡的原理对MIDI进行合成处理，由于技术本身的局限，效果很难令人满意。而的声卡大都采用的是波表合成了，它首先将各种真实乐器所能发出的所有声音（包括各个音域、声调）进行取样，存储为一个波表文件。在播放时，根据MIDI文件记录的乐曲信息向波表发出指令，从“表格”中逐一找出对应的声音信息，经过合成、加工后回放出来。由于它采用的是真实乐器的采样，所以效果自然要好于FM。一般波表的乐器声音信息都以44.1KHz、16Bit的精度录制，以达到最真实的回放效果。理论上，波表容量越大合成效果越好。根据取样文件放置位置和由专用微处理器或CPU来处理的不同，波表合成又常被分为软波表和硬波表。MIDI作曲和核配器系统核心部分是一个被称为序列器的软件。这个软件即可以装到个人电脑里，也可做MIDI代码，在一个专门的硬件里。序列器实际上是一个音乐词处理器（word processor），应用它可以记录、播放和编辑各种不同MIDI乐器演奏出的乐曲。序列器并不真正的记录声音，它只记录和播放MIDI信息，这些信息从MIDI乐器来的电脑信息，就像印在纸上的乐谱一样，它本身不能直接产生音乐，MIDI本身也不能产生音乐，但是它包含有如何产生音乐所需的所有指令。MIDI文件分为单声道MIDI和多声道MIDI。对于多声道MIDI，一些学者尝试从中找出主旋律音轨，然后提取特征信息。但是由于音乐创作的随意性，想从多声道中自动提取主旋律信息是非常困难的。 (责任编辑：qin)

MIDI哼唱检索算法研究+文献综述(6)

时间:2017-06-25 19:27 来源:毕业论文 作者:毕业论文 点击:次

时间:2017-06-25 19:27 来源:毕业论文作者:毕业论文点击:次