2。1局部特征算子概述
局部图像的特征描述的关注点是其不变性和可区分性。图像在发生平移,喜欢、缩放、等变化时,保持不变的特征为不变特征。对于不同的图像,特征具有区分彼此的性能,即区分性。局部特征可以对图像的、灰度值、梯度等信息中进行卷积、获取具有区分性的特征向量;通过模糊算法、仿射变换算法,增加图像的模拟量,已达到各种不尺度、旋转、变形的需求。
2。2SIFT算子
SIFT(Scale Invariant Feature Transform)算法[7]即尺度不变特征变换,在1999年由D。Lowe首次提出,在2004年由其本人得到完善,改算法基于前任。SIFT的提出也是局部图像特征描述算子领域中的一项里程碑式的工作。SIFT算法的特点为对尺度、旋转和光线,一定视角等变化具有不变性,并且SIFT有很强的可续分性。自其提出以来,在物体识别,图像配准拼接,三维建模,图像检索中得到了广泛的应用。
SIFT特征提取分为四个步骤:1。 尺度空间与极值检测;2。 关键点搜索与定位; 3。 方向确定;4。 关键点描述。
2。2。1尺度空间与极值检测
因为无法预先判断目标物体在场景中的尺度,因此,需要考虑物体在多尺度下的表现以获取图像中物体的最佳尺度。如果如想在不同的尺度下具有相同的关键点,那么就可以利用这些尺度不变的特性的关键点匹配目标。通过建立原图像的多个尺度空间构成多层结构,以确保图像的尺度不变性。
高斯核是一种可以产生多尺度空间的核[8] ,图像的尺度空间可定义为原始图像与一个可变化尺度的二维高斯函数 的卷积运算。图像经过高斯卷积之后会比原图像平滑也会模糊。
(1)其中*表示在两个方向x, y上的卷积操作,可以表示为 (2)
尺度空间极值检测需要首先构造高斯及高斯差分DoG(Difference of Gaussian)金字塔,再对DoG金字塔进行极值检测, 初步确定特征点所在的位置和尺度。为了得到多个尺度下的高斯金字塔。高斯金字塔由组(octave)包含层(level)的结构组成,一般选择4组每组有5层。如图2。1所所示,下一组的图像由上一隔点采样得到。将原图像从开始作为第一层做参数的高斯卷积,然后,以下乘以比例系数得到平滑因子组进行平滑形成第二层,重复若干次得到第层,对应的平滑参数为0,,,,第二组的第一层由第一组的最后一层做比例因子为2的降采样然后进行因子为的高斯平滑,之后因子继续乘以k平滑下一层,如此往复,形成高斯金字塔。
DoG算子定义为两个不同尺度的高斯卷积核的差分得到响应值图像,仿照归一化高斯拉普拉斯(Laplacian-of-Gaussian, LoG)算子,对图像的局部进行极大搜索,在位置空间L与尺度空间G中定位特征点。其中:
图2。1 DoG 操作示意图
2。2。2关键点搜索和定位
其中为从每组图像中得到4幅高斯及高斯差分(DoG)图像中寻找极值点,每个经过抽样的搜索点将与相邻层对比。例如图2。2所示,对于图像中的一个像素与它的相邻8个像素及在下层的9个像素和在上一层的秤9个像素进行比较。如果它是一个局部极值(最大点或最小点),则判断这是这个尺度上的近似的极值的极值。基本上,这个关键点是在这个尺度上最好的代表。
图2。2 DoG图像极大极小像素点示意图
通常,上述的搜索都建立在离散的空间上的,极大极小值像素点都不会恰巧在像素点的位置上,连续空间中检测到达极值一般在像素点的中间。因此,要获取关键点的精确位置,利用已知的离散空间点中插值得到连续空间以确定精确位置。通过Dog函数在尺度空间的Taylor展开,通过对求偏导数并将结果置为0,可以计算出方程的极值,从而获得精确的关键点。