1.2 国内外研究现状
1.3本文的主要工作和内容安排
本文主要研究用于铁路监控视频的运动估计算法,包括全搜索算法、三步搜索算法、新三步搜索算法和菱形搜索算法,用MATLAB软件对它们进行了仿真,并比较了各种算法的估计精度和实时性。
本文第一章介绍了课题背景,另外介绍了铁路监控视频的运动估计算法研究现状以及本文的组织结构;本文第二章介绍了运动估计算法的主要分类尤其是常用的运动估计算法。此外还介绍了二文运动估计的分类。本文第三章是全搜索法(ES)、菱形搜索算法(DS)、三步骤搜索(TSS)和新三步骤搜索(NTSS)的原理、步骤、分析。本文第四章是整理和分析各种搜索法的搜索点数和PSNR的数值,判断各搜索法的时效性和精准性。本文第五章对所做的工作进行了总结并展望将来的工作。
2运动估计算法
在帧间预测编码中,相邻图像往往存在较强的相似性,两个相邻图像之间的差别很可能只是其中某一个物体移动了。因此,可以把一个图像分成若干个有运动的对象,再设法搜索出该图像的每个对象在邻近图像中的位置,并求出二者之间的相对位移量,就得到了通常所说的运动矢量。而搜索这个位置并求运动矢量的过程在视频编码技术中被称为运动估计。
2.1 运动估计算法分类
视频的运动估计算法有很多种,大体可分为图像块法、像素法、特征法和相位法四类。
2.1.1 图像块法
块匹配运动估计的基本思想是把视频序列的每个图像都划分成一定规格大小(如16×16、8×8、4×4等)、互不重叠的子块,并且假设各个子块内的所有像素具有相同的运动趋势,只做平移运动,不包括旋转、伸缩等,然后在参考图像的一定范围(称为匹配窗口)内按照预先确定好的匹配准则搜索与之最相似的块,找到的最相似的块为(当前块的)预测块。当前块与预测块之间的位移就是当前块的运动矢量,当前块与预测块图像内容的差值被称为残差图像。此时,在知道参考图像、运动矢量以及残差图像的基础上,就能重构原始图像了。
图像块匹配法的基本原理就是假设当前帧内各像素都是做相同的运动,根据匹配准则(MAD/MSE/PSNR)等,在参考帧给定的搜索范围内找出与当前帧中每一块最相似的宏块,即为最佳匹配块。根据匹配块与当前的相对位置计算出运动矢量,这个运动矢量就是当前块的移动矢量。
实现块匹配主要取决于三个因素:匹配准则、搜索模式和搜索范围。匹配准则实质上是一种误差度量函数,以此为标准衡量两个宏块的匹配程度。匹配准则的选取,直接关系到运动矢量估值的精准度。在块匹配算法中采用不用的匹配准则会获得不同的运动估计结果。匹配准则有很多种,比如最小绝对误差(MAD)、最小均方误差(MSE)、归一化互相关函数(NCCF)、像素差值分类准则、子采样匹配准则、VOD匹配准则以及图像差值均方差匹配准则等。搜索方法就是搜索最佳匹配点的方法,常用的搜索方法有全搜索法(Exhaustive Search,ES)、三步骤搜索法(Three Step Search, TSS)、新三步骤搜索法(New Three Step Search NTSS)和菱形搜索法(Diamond Search,DS)。搜索范围是搜索最佳匹配点的区域,其大小是根据帧图像中运动的类型来选择的。
2.1.2 像素法
像素法就是利用像素灰度值之间的关系进行运动估计。常见的方法有:灰度投影法、光流场法、像素相关法、像素递归法等。
(1) 灰度投影法
灰度投影法将一个二文图像灰度数据匹配简化成两个一文灰度特征匹配,用图像在水平和垂直方向上的灰度投影数据作为图像特征,不仅提高了运算速度还保证了匹配精度。 铁路监控视频的运动估计技术研究(3):http://www.youerw.com/zidonghua/lunwen_8188.html