总体来说,SIFT算子具有以下特性:
(1)SIFT特征是图像的局部特征,对平移、旋转、尺度缩 放、亮度变化、遮挡和噪声等具有良好的不变性,对视觉变 化、仿射变换也保持一定程度的稳定性。
(2)独特性好,信息量丰富,适用于在海量特征数据库 中进行快速、准确的匹配。
(3)多量性,即使少数的几个物体也可以产生大量SIFT特征向量。
(4)速度相对较快,经优化的 Sift 匹配算法甚至可以达到 实时的要求。
(5)可扩展性强,可以很方便的与其他形式的特征向量 进行联合。
2.2 生成SIFT
Sift 特征匹配算法主要包括两个阶段,一个是 Sift 特征的 生成,即从多幅图像中提取对尺度缩放、旋转、亮度变化无 关的特征向量;第二阶段是 Sift 特征向量的匹配。
Sift 特征的生成一般包括以下几个步骤:
1、构建尺度空间,检测极值点,获得尺度不变性;
2、特征点过滤并进行精确定位;
3、为特征点分配方向值;
4、生成特征描述子。
以特征点为中心取 16*16 的邻域作为采样窗口,将采样点 与特征点的相对方向通过高斯加权后归入包含 8 个 bin 的方向直方图,最后获得 4*4*8 的 128 文特征描述子。
5、计算变换参数。
当两幅图像的Sift特征向量生成以后,下一步就可以采用关键点特征向量的欧式距离来作为两幅图像中关键点的相似性判定度量。取图1的某个关键点,通过遍历找到图像2中的距离最近的两个关键点。在这两个关键点中,如果次近距离除以最近距离小于某个阙值,则判定为一对匹配点。
3 词典(树)及词典的建立
Bag-of-visual Words被应用于解决各种多媒体和计算机领域的视觉图像问题。其基本思想是用大量重复和独特的图像元素组成的文件来代表图像,就像文字与文本的关系。然而,大规模的实验结果表明,通常在使用图像词语时,由于在不同应用之间的阻碍使其有效性并不那么理想,其表现并不如文字在文本中的作用。在本文中,将视觉图像中描述视觉图像词语(DVWs)和描述视觉图像短语(DVPs)的提出,对应于文本中的词语和短语,而图像短语指的是频繁一起出现的图像词语组合。由于图像是视觉对象和场景的载体,新型描述视觉元素的集合可以由图像词语及其组合有效地代表某些图像物体或场景。
图像词典就是基于这种思想,提出的一个产生各种典型的图像词语DVWs 和DVPs应用的总体框架。基于对DVW和DVP图像重排的算法:DWPRank比最先进的VisualRank算法的精度高12.4%,效率快11倍左右。
3.1 图像数据的采集
DVW和DVP的生成是根据他们在不同的图像类别候选图像的统计结果。此外,DVW,DVP集对各种物体和场景具有理想的是图像意义和描述。因此,样本图像数据库有足够的对象和场景类别是设置DVW和DVP的重要依据。几十年前,这是非常难以收集如此大规模的标记图像数据库,因为当时有限的数据源代码和硬件的能力。然而,网页图像搜索引擎的热潮和互联网上的爆炸性增长的图像为收集和储存大规模图像数据库提供了可行性。
3.1.1 视觉图像词语的生成
通过聚集大量的SIFT特征描述来提取视觉图像词语。由于要以数百万描述用来作为测试集合,采取高效率的分层K-means来进行聚类。这个做法其中一个优点是分层的K-means的生成的视觉图像词语可以组成词汇树。因此,应用分层结构,寻找局部特征描述最接近的视觉图像词语可以非常有效地执行。聚类后的局部特征描述,是将一个生成的词汇树和叶节点(聚类中心)看做典型的视觉词语。通过在词汇树分层搜索,每个测试类别中的图像都作为样本代替最接近BOW的索引相应视觉词的SIFT特征描述符。在此过程中,每个相似点的规模保持对DVP的候选相应的视觉词在计算时实现规模不变。
- 上一篇:PC838红外接收系统的设计和应用+文献综述
- 下一篇:Matlab的线性分组码及其子码的设计与仿真
-
-
-
-
-
-
-
江苏省某高中学生体质现状的调查研究
g-C3N4光催化剂的制备和光催化性能研究
NFC协议物理层的软件实现+文献综述
上市公司股权结构对经营绩效的影响研究
巴金《激流三部曲》高觉新的悲剧命运
现代简约美式风格在室内家装中的运用
高警觉工作人群的元情绪...
中国传统元素在游戏角色...
浅析中国古代宗法制度
C++最短路径算法研究和程序设计