图像拼接按照配准方法主要分为三大类:基于图像像素的方法、基于图像特征的方法、基于图像变换域的方法。
20世纪末,在该技术领域研究水平较高的Richard Szeliskl教授创新性的提出了模型算法,他提出采用迭代非线性最小化算法,该算法的基本思想是利用图像的特性,结合相关数学算法(比如二维傅里叶变换)来计算得到原始图像的横向位移功率谱以此找到原始图像之间的几何变换关系,为后面的特征点匹配和图像配准打下基础[2]。Richard Szeliskl教授的这个思想的优点是具有快速的收敛速度、将却的像素定位、成像质量高、实用性广、理论实际结合性好,是后人普遍采用的一种经典算法[3]。73358
在这之后,图像拼接技术的研究并未满足科研人员的心理需求和期望,在Richard Szeliskl教授研究的基础上,Shmuel Peleg、Benny Rousso、Alex Rav.Acha和Assaf Zomet等人在迈入21世纪之初便大胆的提出了一种更为方便的算法理论。由于每次取景过程中国我们无法保证相机都能够稳定,同时还会根据不同场景需求来做出不同的角度变换,因此全景拼接模型就会有无数种变化,研究人员更不可能将这么多复杂的运动轨迹制成无数的模型来应用到实际的摄影中去,由此这几位科学家提出了由算法自身计算得到相机的运动方式,然后指定模型来提高算法实现效率。该算法的具体实现方法就是将采集到的图像解剖分为一定数量的条带状图形,然后将其进行重叠、投影,最后完成拼接。毫无疑问,这一创新想法又一次推动了该技术的进步,也更加激励了人们去深入研究,寻找更加快捷、高效的拼接算法[4]。论文网
就在Richard Szeliskl教授即将完善自己提出的算法的同时,1999年D.G.lowe便提出了另一种SIFT算法,直到2005年,这种SIFT描述子被Mikolajczyk和Schmid用实验证明其性能最优[5]。而且Richard Szeliskl教授还在他的基础上提出了改进,即在进行寻找特征点的时候,可以首先利用相关方法把对比度增强,特征点与背景突出的更加明显,提高特征点的配准效率和质量。
与此同时,国内对拼接技术的研究也没有落下脚步。与Richard Szeliskl同年,王小睿等人通过不断研究提出了一种自动图像配准方法[6]。但是该方法局限在是一种半自动配准技术,因此在图像拼接的效率上明显比不上全自动拼接,但是该方法的显著特点就是配准精读极高,适用于工作量小、对成果要求高的全景拼接领域。王小睿提出的这一算法的理论基础就是相似度量法,所谓相似就是衡量图像与已存在模板的关系,确定后进行迅速匹配,而且该匹配利用的是模拟退火算法,匹配效率高。
次年,张祖勋等提出了一种和上述方法互补的全新概念的算法,实现了更高效率的图像配准,而且实现配准的原始图像可以是来自不同空间甚至是不同分辨率。在那之后,华中科技大学的科研者们又提出一种图像特征点相关法的拼接技术,他们的理论可以首先智能化的对两幅图像进行相关性分析,然后创建唯一的相关性模型,最后把两幅不完整图像拼接成一幅更大视角的完整图像。
2002年,杜威、李华两人大胆的设想到可以将图像拼接运动到发展更为广阔的视频等动态场景中去,由此带动了图像拼接的又一次大的跃进[7]。
2004年赵向阳、杜立民在经典的Harris算法[8]的基础上提出一个新的想法,即通过计算寻找到的特征点之间的相似性来进行图像自动拼接[9]。以上提出的拼接算发都具有运算速度较慢这一缺点,而边缘信息闭值法思想中的提取基准特征块并封层搜索这一算法有效改善了运算速度,2005年,侯舒维、郭宝龙等人将这一算法进行完善总结。