毕业论文

打赏
当前位置: 毕业论文 > 计算机论文 >

视频编码中容错率失真优化技术研究(3)

时间:2018-07-09 09:11来源:毕业论文
在多媒体 通信 的各种媒体中,视频信息占据了主导地位。这是因为人们所接受的外部信息中,绝大部分是由视觉获得的。视频信息的庞大数据量给存储和


    在多媒体通信的各种媒体中,视频信息占据了主导地位。这是因为人们所接受的外部信息中,绝大部分是由视觉获得的。视频信息的庞大数据量给存储和传输带来了困难,因此需要对视频进行压缩。之所以能够对视频进行压缩,是因为其数据中存在着大量冗余,这些冗余主要包括空域冗余(图象空间存在很大的相关性)、时域冗余(连续图像间的内容存在很大的相关性)、统计冗余(进行信息熵编码时编码码字存在的冗余)以及心理视觉冗余(人眼视觉系统对图像的色彩和频率特性等的分辨能力有一定限度)等。为消除视频数据的上述冗余,在信息论思想的指导下,自上世纪五十年代以来人们进行了很多研究。对空域冗余,正交变换可以将空域相关的数据转换为变换域中不相关的变换系数表示,同时正交变换还能起到能量集中的作用,能够用若干个低频系数近似表示原图像块的能量。因此变换还可进一步与量化结合,根据人眼的视觉特性,舍弃一些高频系数,从而达到压缩的目的。视频数据中的时域冗余可采用基于运动补偿的预测技术来消除,其基本思想是将连续的视频图像内容进行匹配,对匹配的内容进行差预测,从而降低冗余。对于统计冗余,主要通过提高熵编码的效率来实现冗余度的降低,代表性技术有霍夫曼编码和算术编码等。
    以上这些技术在发展过程中逐渐融合,形成了目前视频编码标准中典型的混合编码框架,主要包括基于运动补偿的预测、正交变换和熵编码器等关键技术。这些技术一直在不断提高和改进[1]。例如,基于运动补偿的预测从单一的前向预测变为后向预测、双向预测、多参考帧预测;进行运动补偿的块大小从16×16,演变为小至4×4的可变块大小运动补偿;运动矢量的精度也从整像素、半像素到四分之一像素。变换由浮点DCT 改变为整数变换;熵编码也由简单的二文变长编码,发展为三文变长编码,再到基于上下文的自适应变长编码。
    在这些技术的发展过程中,陆续形成了一系列针对不同应用的视频编码标准。综合标准的制定时间和编码效率,可将这些标准划分为三代。其中,H.261、MPEG-1和MPEG-2是第一代编码标准的代表。以MPEG-4(Version 1.0,2.0)、H.263、H.263+和H.263++为代表的第二代标准在帧内预测、帧间预测和熵编码方面均有提高。
    2001 年ITU-T 和MPEG 共同组织成立了联合工作组JVT(Joint Video Team),负责制定新一代的视频编码标准,标准在ISO 中称为MPEG-4 Part 10(也称为MPEG-4 AVC),在ITU 中称为H.264。为了适应国内多媒体工业界发展的要求,成立于2002 
年6月的AVS 工作组负责制订中国的视音频编码标准,至今已推出第一阶段面向高清数字电视广播和存储的视频编码标准,即AVS1.0。以H.264/MPEG-4 AVC 和AVS 为代表的第三代视频编码标准在编码效率方面取得进一步的突破,其突出特点在于采用低复杂度的整数变换及无除法量化、多参考帧变换块大小的运动补偿、四分之一像素精度的运动补偿、环路滤波和基于上下文的自适应变长/算术编码等技术。大量的实验结果表明,新一代的视频编码标准比以往任何编码标准的编码效率都提高了至少一倍[2][3]。
1.2 视频传输的差错控制方法
    通常,在视频传输系统中采取措施,加入适当的冗余度可以有助于解码端迅速地进行差错复原。经典的香农信息论指出,可以分别设计信源和信道编码器。只要用低于信道容量的速率表示信源,就可实现压缩比特流的无差错传输[4]。因此,对于给定失真,信源编码器的目标是尽可能地压缩信源,信道编码器通过对信源编码器产生的码流进行前向纠错(FEC),将冗余度加入到压缩码流中,从而纠正传输误码。虽然这种理想的无差错传输只有当实现FEC 时具有无限延迟才能达到,但这种思想已经广泛应用于现有的视频传输系统中。 视频编码中容错率失真优化技术研究(3):http://www.youerw.com/jisuanji/lunwen_19261.html
------分隔线----------------------------
推荐内容