摘要:作为新一代的视频编码标准,H.264提出了许多新的思想和算法,大幅度提 高了编码效率和图像质量。但H.264编码效率的提升是以计算复杂度的增加为代 价的,与MPEG4简单配置相比,H.264主要配置下解码复杂度提高了3倍以上, 而编码复杂度更是增加了10倍。本文的主要工作是对H.264软件编码器进行从算 法级的优化。提出了帧间预测的快速搜索算法。本文提出的快速搜索算法通过判断块的运动类型运用了图像块的各种信息。例如,宏块的运动特征图像块像素的边缘信息、宏块的时空相关性、宏块的内部复杂性宏块模式的分类与统计等,以选择最优的搜索策略有效地减少了搜索点数,提高了编码效率。本文提出的快速模式选择算法,通过 利用边缘方向矢量信息和空间相关性,能有效地降低模式选择的计算复杂度。 22079
- 上一篇:单片机和TFTLCD彩色图片显示系统设计+源程序
- 下一篇:FPGA 基于数字技术的模拟调制电路设计+源程序
毕业论文关键词:帧间预测 帧间模式选择 视频编码
Research on pattern recognition method of H.264fast inter
Abstract: As the new generation of video coding standard, H.264 has put forward manynew ideas and algorithms, greatly improve the coding efficiency and image quality. But the H.264 coding efficiency is by increasing the complexity of calculation for the price, compared with the MPEG4 simple configuration, H.264main profile decoder complexity increases more than 3 times, and the encoding complexity is increased by 10 times. The main work of this paper is on the H.264 software encoder from optimization algorithm class. The fast inter predictionsearch algorithm. Fast search algorithm is proposed in this paper uses a variety of information in an image block by block motion type judgement. For example,the motion characteristic image pixel edge information, macro block the spatio-temporal correlation of macroblock, the internal complexity of macroblock modeclassification and statistics, in order to select the optimal search strategy effectively reduce the search points, improves coding efficiency. Fast modeselection algorithm is proposed in this paper, by using edge direction vector andthe spatial correlation, can effectively reduce the computational complexity of mode decision.
Keywords:Inter frame prediction;Motion estimation;The inter frame mode selection;Motion compensation;Video coding
1 绪论 1
1-1 课题研究背景 1
1-2 视频编码标准 2
1-2-1 MPEG-x 系列标准 2
1-2-2 H.26x 系列标准 3
1-3 课题国内外现状与趋势 4
1-4 论文的主要工作 4
2 H.264视频编码 5
2-1视频编码的基本内容 5
2-2 H.264/AVC视频编码标准 6
2-3 H.264/AVC 的档次和级别 6
2-4 H.264/AVC 编解码器 7
3 H.264/HVC编码技术 10
3-1简介 10
3-2编码关键技术 10
4 帧间预测 13
4-1 帧间预测模式 13
4-2 帧间预测模式种类 14
4-3帧间预测模式方法 15
1) 帧间预测模式的统计分布 15
2) 视频序列的纹理特征分析 16
5 实验测试与结果 17
5-1算法实现 17
5-1-1算法简介 17
5-1-1-2参数设定 23
5-2实验结果统计与分析 26
6 总结与展望 33
致谢 33
参考文献 34
附录, 36
1 绪论
1-1 课题研究背景
20 世纪 90 年代,多媒体技术随着人类进入信息时代而得到了迅猛发展。大信息量的音、视频数据 被广泛使用,如常见的VCD、DVD 等都是将大量的音、视频数据经过处理后供用户使用的。音、视频相关技术在一些行业领域也得到了很好的应用,如保安监控系统中对现场进行音、视频的录制,以便存档、查看、取证等。然而,原始视频图像信号数据量非常大,可考虑分辨率640 *480 下的真彩色图像,一幅图像的数据量就为:640 ×480 ×3=900KB。如果按每秒播放30 帧画面来计算的话,半个小时视频 所播放的图像有 54000 帧,所需的存储空间为:54000 *900KB =48.6GB,这在实际应用中给视频 的存储和传输带来了很大的困难。解决这一问题,仅仅依靠扩大存储器容量或增加通信线路传输率的办 法是既不经济也不现实的。但由于原始视频数据的冗余度最大,如何最大限度地去除冗余,实现视频数据的压缩就成为决定多媒体服务质量的关键因素。因此数字视频技术是多媒体应用的核心,对视频压缩 编码的研究已成为信息技术领域的热门话题.视频压缩的主要依据是利用统计冗余和人类的视觉生理冗余,在允许一度失真的前提下,最大程度的去除这些冗余来减少表示数据所需要的比特数,尽可能的压缩视频数据[1]。统计冗余包括视频图 像同帧相邻像素间存在相关性引起的空间冗余,视频图像序列中不同帧之间存在相关性引起的时间冗余 等;人类的视觉生理冗余,如人眼对亮度分量不如对彩色分量敏感,对图像高频处的噪声不敏感等。这 些冗余信息主要有:空间和时间冗余、信息熵冗余、结构冗余、知识冗余和视觉冗余。视频图像的这些 冗余信息为视频压缩编码提供了依据,去掉这些冗余信息就可以有效压缩数据,同时又不会损害图像的有效信息。