基于超分辨率重建的视频图像压缩方法的研究 第6页
帧,2个B帧,由此构成I PBB PBB PBB……结构。I帧称为参考帧,所谓参考
帧足其它帧都参考的起始帧,所以I帧是一个能够完全记载这一帧全部图像数据
的帧,亦称作全帧。})帧是6,』向预测帧,是根据与jd后一帧图像的比较而得到的
帧。编码时,首先编码I帧,然后以前一个I帧作为预测帧编码P帧,最后在
I帧和P帧之问插入若干个B帧,B帧是由相邻最近的I帧或P帧作为双向预
测后编码的。一般来说,一个GOP中的P帧的信息量约占其I帧的1/2,B帧的信
息量约占其I帧的l/4;解码时,先解码I帧,然后解码P帧,再解码B帧。由
于I帧是帧内编码,不需要其他帧的图像数据,因此可直接解码,P帧的解码则
要依靠所在GO[,中该帧之6仃的I帧和P帧,同样,B帧的解码要依靠所在GO[’中该
帧前后的I帧和P帧,甚至下一个GOP的I帧。因此MPEG一2格式下图像的传送顺
序与显示的顺i序是不同的,假设GOP=9,则图像的传送顺序为:IPBBPBBIB PBB……,
图像的显示顺序则为:IBBI:~BBPBBIBBF’‘…一。
(3)图像层(PL)
PL由数据头和l帧图像数据组成,是图像组层若干幅图像中的1幅,包含了
l幅图像的全部编码信息。MPEG一2图像扫描可有逐行或隔行两种方式:当为逐行
时,图像为逐帧压缩;当为隔行时,图像为逐场或逐帧压缩,即在运动多的场景
采用逐场压缩,在运动少的场景采用逐帧压缩。其中,数据头提供的基本部分有
头起始码、图像编号的时问基准、图像(I、B、P)帧类型、视频缓存检验器延迟
时问等,扩展部分有图像编码扩展、图像显示扩展、图像空间分级扩展、图像时
间分级扩展等。其中,基本部分由MPEG—l及MP[!G一2共用,扩展部分由MPEG一2专
用。一幅视频图像是由亮度取样值和色度取样值组成的,而亮度与色度样值比例
的大小是由取样频率之比决定的。在MPEG一2中,亮度与色度之间的比例格式有
4:2:0(或4:O:2)、4:2:2、4:4:4三种。
(41宏块条层(SL)
SL由附加数据和一系列宏块组成,其最小长度=1个宏块,当长度=图像
宽度时,就成了MPEG一2层面中最大宏块条长度。为了减小误差,提高图像质量,
将图像数据分成由若干个宏块或宏块条组成的一条条位串。一旦某宏块条发生误
第2章视频图像压缩技术及超分辨率重建技术的概要
差,解码器可跳过此宏块条至下一宏块条的位置,使下一宏块条不受有误差而无
法纠正的宏块条的影响,一个位串中的宏块条越多,隐匿误差性能就越好。为此,
附加数据部分定义了宏块条在整个图像中的位置、默认的全局量化参数、变量优
先切换点(PBP—Priority Break Point)。其中,PBP用于指明数据流在何处分开,
解码器要在两个数据流的恰当点处切换,以保证读取完整、『F确的解码信息,确
保解码完整无误。需要注意的是,在离散余弦反变换(IDCT—Inverse Discrete
Cosine Transform)时,SL可提供重新同步功能。如图2.2所示。
┏━━━━━━┳━━━━━━┳━━━┳━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┳━━━━━┓
┃取样频 ┃ 宏块结构 ┃ ┃ 取样值排列顺序 ┃ ┃
┃ 率比 ┃(取样结构) ┃ ┃ l 2 j 毒 5 6 了 撼 哮 l(} II 12 ┃说明 ┃
┃ fl珏z' ┃ ┃ ┃ ┃ ┃
┣━━━━━━╋━━━━━━╋━━━╋━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╋━━━━━┫
┃ ┃ l:2:O ┃ ┃ ┃ ┃
┃ 13.5: ┃ Y网 ┃Y ┃ ● # ● # 《 t ● ● ● # t 女 ┃ ┃
┃ 6.75: ┃山 ┃≮ ┃ * + { + ‘ + “ + # + “ ‘ ┃ ┃
┃ O ┃e.田 ┃ ┃ + + + + + + + + + + 警 + ┃ ┃
┃ ┃ ┃《 ┃ ┃ ┃
┣━━━━━━╋━━━━━━╋━━━╋━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╋━━━━━┫
┃ ┃ 1:0 2 ┃ ┃ ┃ ┃
┃ 15.5: ┃ Y圈 ┃Y ┃ ● # % * # # ● # ■ # $ t ┃ ┃
┃ ┃ ┃ ┃ ┃ “^” ┃
┃ O ┃e. ┃‘ ┃ + + + + + + ÷ ÷ + + + + ┃ ┃
┃ ┃ ┃ ┃ ┃ 样值 ┃
┃ 6.7S: ┃‘固 ┃≮ ┃ ● + ● + _ ÷ ● + ● + ● ● ┃ ┃
┣━━━━━━╋━━━━━━╋━━━╋━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╋━━━━━┫
┃ ┃ 4:2:2 ┃ ┃ ┃ ┃
┃ 13.S: ┃ Y圈 ┃Y ┃ # } # ● # ● ● ● ● ● # # ┃ ┃
┃ ┃ ┃ ┃ ┃ “+,, ┃
┃ 6.7菩: ┃ ┃ G ┃ ● + # + ● + ● + ● + ● ● ┃ 非样 ┃
┃ 5.75: ┃cr团 ┃ ┃ ┃ ┃
┃ ┃C圈 ┃≮ ┃ ● + ’ + # + ● + # + ● ● ┃ 值 ┃
┣━━━━━━╋━━━━━━╋━━━╋━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━╋━━━━━┫
┃ 13.5: ┃ Y圈 ┃ Y ┃ # * ● * * 女 ● ● ● # # # ┃ ┃
┃ 5.7S: ┃ ┃ ≮ ┃ t 毫 - 毒 害 * 奉 母 巾 l ■ 幸 ┃ ┃
┃ 6 75: ┃ e田 ┃ (: ┃ * ^ § ^ ^ # # ^ ‘ * ^ { ┃ ┃
┃ ┃ <圈 ┃ ┃ ┃ ┃
┗━━━━━━┻━━━━━━┻━━━┻━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━┻━━━━━┛
(5)宏块层(ML)
幽2.2宏块结构图
Fig.2.2 Macro block’S structure
基于超分辨率重建的视频图像压缩方法的研究 第6页
ML是宏块条层中一系列宏块中的l块,由附加数据、亮度块和色度块共同组
成。其中,亮度为16×16像素块,称为宏块。宏块是码率压缩中运动补偿的基
本单元,由4个8×8像素块构成,用于消除P图像与B图像之问的时『日J冗余度。
色度块由多少个8×8像素块构成,取决于亮度与色度之间取样频率的比例格式。
如MPEG一2有4:2:O、4:2:2、4:4:4三种宏块结构,取样结构如图2.4所示。图
中4:2:0是由4个8×8亮度(Y)像素块、2个8×8红色(Cr)像素块及0个
8 x 8兰色(Cb)像素块构成的,或4:0:2是山4个8×8亮度(Y)像素块、0
个8×8红色(Cr)像素块及2个8×8兰色(Cb)像素块构成的,4:2:0与4:0:2
是交替进行的,使垂直分解力降低(类似4:1:l使水平分解力降低),只含有1/4
的色度信息。4:2:2是由4个8×8亮度(Y)像素块、2个8×8红色(Cr)像
素块及2个8×8兰色(Cb)像素块构成的,只含有1/2的色度信息。4:4:4是
由4个8×8亮度(Y)像素块、4个8×8红色(Cr)像素块及4个8×8兰
色(Cb)像素块构成的,是全频宽YCrCb视频。宏块层ML包含P帧及B帧的
运动矢量(Mv—Motion Ve(:tors)。附加数据包含的信息有:表明宏块在宏块条层中
位置的宏块地址、’}兑明宏块编码方法及内容的宏块类型、宏块量化参数、区别运
动矢量类型及大小、表明以场离散余弦变换(DCT—Discrete Cosine Transform)
还是以帧DCT进行编码的DCI、类型。
(6)块层(BL)
BL是只包含1种类型像素的8×8像素块,即单一的8×8亮度(Y)像素块,
或是单一的8×8红色(Cr)像素块,或是单一的8×8兰色(Cb)像素块。它是
提供DCT系数的最小单元,即其功能是传送直流分量系数和交流分量系数。若需
要对宏块进行DCT,也要先将宏块分成像素块后再进行。
2.2.2 MPEG一2帧内帧间编码结构 ,
为了在高效压缩编码的条件下获得可随机存取的高压缩比、高质量图像,MPEG
定义了I、P、B三种图像格式,分别简称为帧内图(Intra Pi cture)、预测图
(Predicted Picture)及双向图(BidirectiOnal Picture),即I帧、P帧及B帧,
用于表示l,/30s;时问『口J隔的帧序列画面。要满足随机存取的要求,仅利用I帧本
第2章视频图像压缩技术及超分辨率重建技术的概要
身信息进行帧内编码就可以了;要满足高压缩比和高质量图像的要求,单靠I帧
帧内编码还不行,还要加上由P帧和B帧参与的帧『白J编码,以及块匹配运动补
偿预测,即用前一帧图像预测当前图像的因果预测和用后一帧图像预测当前图像
的内插预测。这就要求帧内编码与帧问编码平衡,因果预测与内插预测间的平衡。
平衡的结果是随机存取的高压缩比、高质量图像的统一。图2.3是MPE6—2帧『白J
编码结构图。
(1)帧内编码图(ICP)
I帧为不要基准图像编码作为基准所产生的图像,称为帧内编码图
(ICP—Intra Coded Pictures)。特点是:数据量最大;帧内中等程度压缩;无运
动预测,可采用自相关性,即帧内相邻像素、相邻行的亮度、色度信号都具有渐
变的空间相关性,可作静止图像处理,无条件传送;图像可随机进入压缩图像数
据序列,进行编码。
(2)预测编码图(PCP)
P图是以最近的上一个I帧或P帧为基准进行运动补偿预测所产生的图像,称
为预测编码图(PCF’一Predictive Coded Pictures)。P帧的特点是:本身是前I帧
或P帧的前向预测(FP—FoI’ward Prediction)结果,也是产生下一个P帧的基准
图像;高编码效率,与I帧相较,可提供更大的压缩比;前一个P帧是下一个P
帧补偿预测的基准,如果前者存在误码,则后者会将编码误差积累起来并传播下
去。
(3)双向预测编码帧(BPCt,)
目前对B帧有两种理解:其一,B帧是同时以前面的I帧或P帧和后面的P帧
或I帧为基准进行运动补偿预测所产生的帧,称为双向预测编码帧
(BPCP—Bidirectional Predictive(;oded Picture)。前面的I帧或P帧代表‘‘过
去信息”,后面的P帧或I帧代表“未来信息”,由于同时使用了“过去”和“未来”
两种信息,所以称为双向预测。其二,由于帧序列相邻帧画面问的运动部分具有
连续到时『甘J相关性,可将当前画面看成是前一画面某一时刻帧的位移,当然位移
方向及幅值在帧内各处未必相同,只要用前面最近时刻的I帧或P帧及代表运动
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>
基于超分辨率重建的视频图像压缩方法的研究 第6页下载如图片无法显示或论文不完整,请联系qq752018766