25
1 引言
1。1 研究背景和意义
人类或者其他生物通过视觉观察并得到外界物体的种种特征,获取很多对自身有利的且至关重要的各种信息。统计显示,我们人类通过嗅觉、视觉、触觉等等感官从外界获取的所有信息中,其中通过视觉获取的大概就占了80%[1]。物体的三维立体形态特征是物体除了颜色等特征外最为重要的特征之一[2]。
对外界三维场景的认知,辨认,识别和理解是人类的视觉功能,用计算机实现这种功能就是计算机视觉的主要目的[3]。立体视觉在计算机视觉中发挥着举足轻重的作用,它很直观的仿照了人类两眼处理场景中景物的方法,能够在各种情况下测量景物的三维信息以及判断远近,对比与其他多种多样的计算机视觉方法,其作用无法被取代。不管从什么角度出发,对于人类社会以及人类的生活来说,立体视觉的研究都具有异常重要且不可替代的作用和意义。立体视觉技术大约开创于上世纪60年代中期,来自美国M IT的Robert教授经过努力研究最终完成了分析三维景物的工作[4][5],将过去的二维图象分析发展到了三维景物,立体视觉技术就此宣告诞生了,并在紧随其后的20年里飞速成了一个体系,进而演变成一门全新的学科。时间悄悄来到了1977年,来自波士顿麻省理工学院的David Marr教授在人工智能实验室总结出了较为完备的视觉理论系统框架[6]。
二维图像 要素图 2。5维图像 三维图像
图1。1 Marr 提出的计算机视觉的过程
经过科学家20多年的努力探索和研究,双目立体视觉已经在三维检测、军事任务、机器人导航、医学成像等领域被大范围的普及[7]。研究方法已经发展到具有高度的生理学背景的特征匹配并且依赖于特征、结构、关系和知识的高层次处理。区别于先前的以研究相关理论为基础的相关匹配并且直接依赖于输入信号的低层次处理。随着相关研究和理论正处在不停地发展与完善之中,系统机能不断提高[8]。双目立体视觉的基本思想是从两个不同视点拍摄同一景物,以获得在不同角度下的拍摄图象,通过各种测算方法计算两个图象象素间的视差(即位置偏差)来获得所拍摄景物的三维立体信息包括高度,宽度,深度等等信息,这个过程十分相似于人类双目视觉的运行机制。一整套完备的双目立体视觉系统一般可分5个大部分,他们分别为图象获取、摄象机定标、特征提取、立体匹配、深度确定等[9]。文献综述
1。2 国内外研究现状
1。3 本文的主要工作及其章节安排
本文在学习了现有的几种立体视觉算法之后,选取了基于特征的算法研究,并且通过在Matlab软件上进行程序设计实现算法仿真,针对从专业网站上得到的实验素材图片进行立体匹配以及深度提取,并对不同结果进行比较和分析。
第一章研究了双目立体视觉技术的背景和意义,同时阐述了该技术在国际上和国内的研究现状;
第二章详细阐述了立体视觉算法中三种不同的立体匹配算法及其优点和缺点。以及分析了干扰立体匹配效果的各种因素比如摄像机标定问题以及拍出的照片种种问题。最后阐明,为方便本文做研究,采用了Middlebury college官方网站提供的一组素材图片,这组图片是专门用于立体视觉研究的。
第三章完成了基于特征的立体匹配算法程序设计,并加以改进,简化了计算,提高了计算速度。并利用Matlab仿真软件对程序进行仿真,运用对比的方法验证了本文的改进的正确性。 用于立体视觉的景深信息生成方法改进Matlab仿真(2):http://www.youerw.com/zidonghua/lunwen_97264.html