发展趋势
在真实的应用程序中的音乐检索范围广泛的声音文件格式类型和品种的声音混合的各种各样的语言,如何使旋律记录格式满足人耳的知觉特性,并提供高效方便的查询结构。检索遇到的问题是哼唱音乐音频信号注释特征信息自动分割法的准确性,如何直接影响检索效果根据实验分析使用现有的音频提取工艺注意到分割是容易错误.例如哼唱声比较弱或发音方式不限制等。第二是复合的曲波数据源音频信号的特征信息自动提取的音乐旋律方法或多个轨道的特征信息的数据提取方法中自动音乐主旋律音乐剧还没有得到很好的解决。第三个问题是旋律特征识别法和音乐搜索算法,实现从音频信号中提取旋律特征信息的过程中,不可避免地会存在的人的哼唱错误以及人们记忆中的错误,由查询内存音乐会不准确和哼唱人员的非专业性哼唱输入本身也将存在错误这两个领域错误是影响系统性能的非常重要的因素,因此非常有必要的系统分析这些特定类型的错误. 当需要从一大堆音乐库中寻找出所关心的歌曲但是又不记得它的名字或者作曲者的时候,音乐哼唱检索系统的提出很好地切合了这种具有实际意义的需求。基于哼唱的音乐检索技术对于音乐的快捷查询、练歌者的自我训练以及帮助作曲家自动记谱等方面都有很好的应用前景,它有可能成为下一代音乐检索的核心技术之一。从分类上看,音乐哼唱检索是一种音乐检索技术— 音乐相似性查询的一个特别的分支,其难度较之使用音乐片段作为输入来检索音乐要大得多。在哼 唱 检 索的相关领域,现有主要的研究工作大都集中在以IMDI为代表的数据库基础之上,而在MP3音频数据库的领域还鲜见突出的研究成果。有一些简单的软件或硬件合成器可以方便地把MIDI类型的数据转化成音频信号并播放出来。然而,到目前为止还没有一种已知的算法,可以比较准确地把这个过程反过来实现,即把音频信号转化成MIDI数据或者乐谱。已有的研究表明,对于面向单乐器的如钢琴等纯乐曲的单音(monophonic)形式的Mp3,对音乐的单音记谱是可行的。但是,绝大多数Mp3都是多音形式的,同时含有乐器伴奏和人声演唱,很多情况下还伴有和声。对于这种形式的音乐信号,目前尚没有理想的提取旋律的方法。这对于提高面向音频数据库的哼唱检索系统的性能构成了具有挑战性的课题。考虑到日常生活中的哼唱检索应用可能需要在嘈杂环境中使用。 音乐检索技术国内外研究现状和发展趋势(2):http://www.youerw.com/yanjiu/lunwen_9875.html