3 数据库旋律特征提取
3.1 旋律的特征选取
在实际的演奏中,不同的演奏者在使用不同的乐器演奏时,音强和音色往往是不同的,系统无法根据音强和音色特征对音乐进行检索匹配。因此我们在实际系统中采用由音高和音长组成的二文向量表征音乐的旋律特征。在具体应用中,主要有两种不同的表达方式,分别是:绝对音高音长序列和相对音高音长序列。可以想到的最简单的特征,就是旋律的绝对音高音长序列。绝对音高音长序列包含旋律的准确音高和音长,其优点是可以对音乐旋律进行完全精确的检索。例如人们常将整个音高范围平均划分为11段,用字母0到10表示。每一段中的音高值从低到高依次用字母C, Db, D, Eb, E, F, Gb, G, Ab, A, Bb, B表示。
尽管通过绝对音高音长序列可以非常精确的检索到相关的乐曲旋律,但也有其不足之处:首先,它要求检索者非常准确的把握歌曲旋律的音高和音长,这种方式对于音乐知识并不丰富的一般检索者来说是比较困难的。其次,有些音乐的旋律中存在大量即兴的、不确定的因素。比如一些民族音乐的音调是不固定的,不同的演唱者、不同的乐器在演奏时其音调可能会发生改变,尽管此时音乐的旋律还是一样的,但由于其音调不同,所以基于绝对音高的音高序列就是完全不同的,显然这将肯定导致检索的失误。再次,对于音域不高的哼唱者,哼唱音调很高或者很低的歌曲时,往往会低一个调或高一个调,如果采用绝对音高进行检测,同样会产生严重的错误。
针对绝对音高音长序列的不足,相对音高音长序列在实际中应用的更为广泛。该方法用“*”表示音高或音长序列的开始,然后依次将后一个音符的音高和音长与前一个音符进行比较,并分别用“U、 D、 R”三个参数表示音高的上升、下降、不变或音长的变长、变短、不变。该方法可以有效的解决绝对音高音长序列的不足,在实际应用中可以达到不错的效果。
3.2 数据库音频文件的格式选定
目前常用的计算机音乐文件格式有多种,每种格式能支持的音频参数和使用环境各不相同。根据一记录声音的原理,音频文件通常可以分为三类,分别是:声音文件、MIDI文件和模块文件。
声音文件(wma,aiff, au, mp3, wav, 等)直接记录了声音波形的二进制采样数据,是对声音的真实反映。这样存储声音信息所产生的声音文件是相当大的。MIDI文件记录了音乐演奏指令序列,说明在什么时间、用什么乐器演奏什么音符,及如何演奏等等,并不包含真实声音的数据,所以文件尺寸要比声音文件小得多。模块文件(mod, mtm, s3m,, kar, it, xm,等)同时具有MIDI与声音文件的共同特性,也就是说模块文件中既包括如何演奏乐器的指令,又保存了声音信号的采样数据。
在三种音频文件中,记录了音乐演奏指令序列的MIDI文件和模块文件对于每一个音符的这三个特征都有完全量化的准确描述,播放设备就是根据这些特征来合成回放音乐的。所以从MIDI文件和模块文件中提取音乐旋律是十分精确的,可以完全反映音乐的旋律特征。而声音文件则是记录了真实声音的波形采样数据,由于采样频率、采样深度的不同,其对真实声音的记录效果也大相径庭,要从中提取出比较精确的旋律特征就相对困难,就精确度而言,肯定不如另外两种文件格式。表3.1是三图种音频文件的对比:
表3.1 三种文件的对比
通用性 编辑性 内容 文件大小
- 上一篇:MATLAB铁路监控视频的超分辨率技术研究
- 下一篇:仿生模式识别方法及应用的研究+文献综述
-
-
-
-
-
-
-
中国传统元素在游戏角色...
高警觉工作人群的元情绪...
浅析中国古代宗法制度
C++最短路径算法研究和程序设计
现代简约美式风格在室内家装中的运用
NFC协议物理层的软件实现+文献综述
上市公司股权结构对经营绩效的影响研究
g-C3N4光催化剂的制备和光催化性能研究
江苏省某高中学生体质现状的调查研究
巴金《激流三部曲》高觉新的悲剧命运