Philips乐曲检索系统之特征提取算法实现(3)

随着数字音频处理技术和互联网技术的发展，音乐和语音等各种形式的数字音频作品的编辑和传输也变得极其便利。由于数字信号编辑的隐蔽性，经过互联网传输后的音频信息的真实性受到了怀疑。因此需要一个安全的音频认证系统来验证音频内容的完整性和真实性。传统的音频认证通过水印技术来完成，即在原始音频中嵌入表示特定信息的水印，在接收端通过检测隐藏水印的状态来判断声像信号是否被编辑、改变过。但基于水印的音频认证系统中，水印的嵌入需要修改原始音频信息，由此可能对音频质量造成潜在的影响。另外系统的可靠性也完全依赖于水印的嵌入方法。而音频指纹是从音频中提取的代表音频内容的具有音频声学特征的紧致的数字签名，通过与原始指纹比对后即可得出音频是否遭受篡改的认证结果。因此不需要对音频的原始信息进行改动，是除半脆弱水印技术外多媒体认证的另一项重要技术。
1.2   数字音频指纹的应用
目前，数字音频指纹在各领域的典型应用主要包括以下几种：�
1.2.1   音乐识别
音乐识别是音频指纹技术最原始和最广泛的应用。目前己经出现了一些实际运行的产品。2004 年美国Gracenote Inc 与荷兰皇家飞利浦研究院(Philips Research)共同开发了可通过手机使用的乐曲识别软件“Gracenote Mobile”。它结合了Philips 音频指纹识别技术和Gracenote 的“波形指纹信息数据库”。例如：当用户希望知道所听乐曲的名字及其艺术家姓名时，可以用手机拨通Gracenote Mobile 的服务电话，通过手机收集周围的声音向服务器传输5 一10 秒钟的乐曲。服务器根据发过来的部分乐曲进行识别处理后，通过短信息向用户手机发送找到的乐曲名、艺术家名及一些图象信息。西班牙移动通信运营商Amena 公司也采用Philips 的音频指纹技术提供一种称为Musicwave 的音乐识别服务。MusicBrainz 是美国MusicBrainz 基金的非赢利项目，使用Relatable LLC 开发的TRM 音频指纹技术作为数字媒体的唯一条形码来提供数字音频的查询服务。英国Shazam娱乐有限公司从2002 年8 月份也开始提供此类服务，但基于不同的音频指纹技术。在中国，北京酷我科技有限公司应用其音频指纹技术实现歌曲的精确匹配和识别，并建立了一套大型音频指纹数据库系统，为广大互联网网民提供音乐识别服务。开发的音乐识别软件名称是“酷我MP3 伴侣”，它能根据音乐的旋律准确识别歌曲并提供歌名、歌手、专辑名、歌词等信息。识别后的歌曲无论在音乐播放软件还是便携式MP3 播放器中都会显示正确的信息。�
1.2.2   音频认证
音频认证技术就是一个实现对音乐、语音等音频数据完整性/真实性进行保护的有效技术手段。它可以保证接收到的音频数据在传送过程中没有经过第三方的恶意编辑和篡改，即在人类感知系统的意义上与原始音频是完全相同的。该技术在政府部门、国家安全、法庭辩护、商业机密、新闻、录音讲话、音乐录制发行、军事等许多领域都有广泛的应用及巨大的社会效益。目前基于音频数据的多媒体认证技术在国内外研究界尚处于起始阶段，已发表的文章很少，未查到已申请成功的专利，成熟的商业化软件亦未出现。使用数字指纹进行音频数据认证技术的研究属于多媒体信息安全领域的前沿性研究涉及的知识面大，技术难度高，具有很大挑战性。如何有效提取紧致的数字指纹来区分恶意操作和保持内容的操作是一个难题。
1.2.3   音频内容控制和跟踪
发行端监控:内容发布者在电台音乐数据库里寻找某段音乐以决定他们是否有权播放。 Philips乐曲检索系统之特征提取算法实现(3):http://www.youerw.com/jisuanji/lunwen_2880.html