第四章:基于边缘检测的差错隐藏方案,针对JM空域差错隐藏的局限性,提出了自己的差错隐藏改进算法,即基于边缘检测的方案,并在JM上实现该算法,得出仿真结果。
2. 视频编码基本理论
数据压缩技术的研究已有几十年的历史。从基本原理方面,可以把压缩技术分成两大类:一类是基于率失真理论的,在这类方法中,视频图像序列由一组在空间和时间上取样得到的像素值表示;然后采用一般信号分析的方法消除数据的冗余,如空间冗余、时间冗余、知识冗余、结构冗余、视觉冗余、纹理统计冗余等,来达到压缩的目的。数据压缩的最终目的就是从源信号中去除冗余,使用来表示图像的一组数据互不相关,从而提高编码效率。但是这种给予率失真的方法主要了解的是信源的统计特性,而不关心图像的内容,也很少考虑人眼的视觉特性。这种方法被称为第一代图像压缩编码方法。如EG、MPEG-1、H.263等。
第二类压缩技术是针对对象模型的编码方法。这类方法是针对人眼视觉特性的研究,其核心思想是根据人眼识别图像或视频的关键特征来构造图像模型。这种编码方式充分利用了人眼特性、心理特性等,使得编码变得更加有效。这类方法也被称为第二代压缩编码技术。与第一代编码技术相比,由于使用“区域”或“对象”来表征视频信号,其冗余数据比较小,压缩比较高,而且可以实现交互性功能。
H.264属于第一代编码技术,采用的仍然是变换和预测的混合编码框架。这种框架如图3所示。
图3 H.264编码器框图
本章将研究第一代编码技术中的三大类编码方法。
2.1 预测编码
预测编码是最简单实用的视频压缩方法,经过压缩编码后传输的并不是像素本身的取样值,而是取样点的预测值和实际值的差。
这种方法利用的是图像像素之间的空间连续性和图像序列之间的时间连续性造成的信息冗余。大量统计表明,同一帧图像中的相邻像素变化较小,前后帧对应位置上的像素变化也很小。人们利用这种性质研究出了预测编码。
根据预测像素的位置在哪里,人们把预测编码分成了两种:帧内预测和帧间预测。帧内预测指取样的是同一帧的相邻位置的像素,帧间预测取样的是时间上相邻,即前后帧中的像素。
根据预测方法是否是线性的,又可以把预测编码方法分为线性预测和非线性预测。非线性预测的预测值是由相邻预测像素值非线性构成,算法比较复杂。而线性预测的预测值是由相邻像素预测值线性构成,目前应用最多的就是编码调制DPCM,算法简单,易于实现。
2.1.1 DPCM编码原理
差分脉冲编码调制建成为DPCM,是预测编码的一种基本形式。其编解码端原理图如下图所示。
输入信号 二进制码流
图4 DPCM预测编码框图
在编码端分成了三部分:线性预测器、量化器(包括反量化)和变长编码VLC。预测器是DPCM预测编码的关键,是用已编码像素值来预测要编码的像素值。它的设计主要是确定预测器的阶数N(即预测器所用的样值数)以及预测系数。
在编码端,对当前输入像素值与预测器输出的预测值相减后,得到的是预测误差值,经量化器量化后再交由变长编码部分就生成码流。而在解码端则先进行变长解码然后反量化,最后与预测值相加得到重建的像素值。
设 表示原先输入信号, 为用先前N个已编码像素预测的预测值, 为预测差值,即 。 经量化器量化之后输出为 。 一方面经过变长编码生成二进制码流输出到信道上;另一方面经过反量化处理得到值 ,并与预测值 相加存储在内存中,作为下一个输入像素的预测值或预测值之一。 H.264差错隐藏技术研究及改进+文献综述(4):http://www.youerw.com/jisuanji/lunwen_3067.html