从八十年代开始,很多大的国际性公司,为了设计开发多媒体计算机系统以及通信系统,专门研制了自己的音频视频信息压缩解压缩算法,为了提高速度,投入了大量研究经费,设计制造了专用集成电路,当时在国际市场上取得了良好的经济效益和社会交易。但是随着国际标准化组织ISO先后制定了 ISO/IEC 10918 [ 连续色调静态图像的数字压缩和解码(EG)]、ISO/IEC 11172(具有1.5Mbit/s数据传输率数字存储媒体运动图像及其伴音的标准MPEG-I)以及CCITT制定的H.261(Px64Kbps 视声业务编码方式)等标准,使得一些不符合国际标准的产品的技术发展受到限制。国际标准化组织于1988年就成立了一个致力于制定有关运动图像压缩编码的组织。组织在工作一开始就考虑到相关标准化组织的研究成果,如EG和H.261标准。运动图像可以看成是静止图像的一个系列,所以图像运用的帧内解码器中就采用了EG推荐的技术,此外又加进了帧间压缩技术(运动补偿技术)。到1992年MPEG正式推出了MPEG-I标准草案,1993年正式通过。
MPEG 是Moving Pictures Experts Group (运动图像专家组)的缩写。在MPEG-I
(ISO/IEC 11172-3)中,对音频压缩规定了三种模式,即层I、层II、层III。VCD中使用的音频压缩方案就是MPEG-I 层I;而层II由于其适当的复杂程度和优秀的声音质量,在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用;MP3是在综合MUSICA、ASPEC的优点的基础上提出的混合压缩技术,MP3的复杂度显得相对较高,但由于其高品质、高压缩比,使其应用最为广泛[1,2]。
MP3是MPEG标准中的音频标准中的一部分。1987年,IIS开始进行有关实用的音频编码方面的工作。它们同Erlangen大学合作开展了一个项目,最后IIS提出了一个非常优秀的算法,也就是ISO-MPEG-I音频的第3层,同时通过的ISO 11172-3标准也就成为了MPEG标准中的一部分。后来,在MPEG-I的基础上,又提出了MPEG-II的编码标准,该标准的音频部分与MPEG-I的音频部分在算法上基本一致,但提供了与CCITT的G-722相类似的16KHz、22.05KHz和24KHz的采样速率,这样就使得MP3也可以用于低比特率(<64Kbit/s)语音通信中。同时,为了适应多通道语音通信的需要,新标准又提出了多语音通道的压缩方法,并且可以提供一个额外LEF通道(low frequency enhancement channel),该标准后来被命名为ISO 13818-3标准。
然而,尽管MP3的压缩格式已成为网络、随身设备等的主流,但在要求更高的低比特率传输中,MP3格式的音频文件就会无法达到要求。因此,在MPEG-II标准中,还定义了一种编码算法:MPEG-2 AAC(ISO/IEC 13818-7),这是一种与MP3不兼容的压缩编码,其算法复杂度和声音品质都高于MP3。
AAC(Advanced Audio Coding)与MP3的编解码格式相比,其优点有:
① 改良后的压缩技术能实现较小的文件提供高质量的声音效果。
② 支持多声道音频,提供多达48个全频声道。
③ 高的音频解析度,采样率达到96KHz。
④ 提高解码效率,要求较低的解码处理能力。
现在最新的音频压缩技术是建立在AAC基础上的EAAC+,其相比于AAC具有更加优良的性能。EAAC+技术的核心是AAC编解码技术,在AAC的基础上加入频谱重建处理部分(Spectral Band Replicatin,SBR),形成AAC+,另在3GPP标准的第优尔个版本中引入参数立体声(Parametric Stereo,PS)部分,最终合成MPEG-4 EAAC+的技术。由于其很高的压缩比和良好的音质效果,已经成为了MPEG-4、3GPP、3GPP2规范的核心内容,并肩逐渐成为因特网、无线通信、数字广播等领域音频多媒体数字信号编解码器的首选技术。
数字音频的压缩今后的发展方向是朝着高压缩比、低比特率、高保真度的方向发展。随着处理器性能的不断提高,MPEG标准组的AAC以及与此兼容的EAAC+有着 基于SEP3203的MP3播放器实现+流程图(2):http://www.youerw.com/tongxin/lunwen_7090.html