计算机视觉技术其实质是起源于视觉系统的,其发展是由Marr在20世纪80年代初首次提出了视觉系统的框架而渐渐兴起的,他从信息处理的角度结合了多种技术,图像处理、心理物理学、神经物理学以及临床的神经病学。其理论具有两个核心:(1)人类视觉包括生物视觉的主体是将所看到的信息在大脑中重构为物体表面的几何的形状;(2)视觉重构的整个过程是由计算机的计算方式完成[20]。
2.8 本章小结
在第二章中将2D场景的数据重构成3D场景的方法被详细介绍,点云算法和深度景深图的显示方法在本文中被运用。根据检测,跟踪目标物体的原理,将其使用到3D立体场景中,对于大量的数据进行运算和重构,检测、跟踪目标运动物体。
本章中,重点介绍了对于目标物体检测、跟踪所涉及到的主要技术以及学科的理论原理。其中包括以下九种中原理:
1) 图像预处理的几种方法
2) 图像形态学的腐蚀填充
3) 膨胀处理
4) 前景物和背景物的边缘检测
5) 平滑滤波处理
6) 前景物和背景物的分离
7) 图像二值化处理
8) 检测运动物体的运动状态以及跟踪
9) 在三文景深图像的背景下对目标运动物体的检测跟踪二文图像重构呈三文图像
在整个过程中,介绍了三个坐标系拟合成一个坐标系的算法。点云算法被用来将数据一点点的重构出3D的效果,或者将数据分析其远近的参数,接着由摄像头显示出3D场景的立体图像。结合计算机所视觉技术,预处理图像,检测器目标物体,并且精确对其进行分割的方法,将3D场景中的运动物体检测出来,并且进行跟踪。
第3章 软件平台的搭建
3.1 OpenGL
OpenGL(Open Graphics Library)是一个专业的图形的程序接口,显示立体三文图像的功能强大,底层图形库调用方便。提供了一个跨编程语言\跨平台的编程平台。
OpenGL是独立于操作系统的开放的三文图形的软件开发包,在其基础上开发的应用程序能够简单方便的移植于各种平台。本论文,将其结合了OpenCV视觉处理算法,实现视频三文图形的显示。还结合了Visual C++编程平台,实现对于复杂背景中目标运动物体的检测和跟踪。保证检测、跟踪物体算法的正确性、精确性以及可靠性。主要功能如下七点:
1)变换图形。OpenGL利用基本变换以及投影变换处理图形。基本变换就是对于2D平面图形的平移、旋转、变比、镜像变换。投影变换就是对于3D立体图形的平行以及透视投影。通过变换方式,可以将2D的平面图形清晰明了的变换成3D的立体图形,并且减少了计算时间还提高了图形显示的速度。
2)设置光照、材质。OpenGL库中包含了多种光照的类型。材质是用光反射率来表示的。是基于人眼的原理,场景中的物体是由光的红绿蓝的分量以及材质的红绿蓝的反射率的乘积后所形成的颜色值。
3)位图显示和图像增强的扩展功能。即其功能包括读写、复制像素外,对一些特殊图像的处理:例如,融合、反走样、雾的等等特殊处理方式。可以使图像的重现和处理效果更真实逼真。
4)建立3D模型。OpenGL除了能够处理一般的2D图形,即点、线、面的绘制外,主要任务是集合3D立体的物体来绘制函数。
5)颜色模式。OpenGL库中的颜色模型:使用较为广泛的RGBA模式以及颜色索引模式(color index)。
6)纹理映射。能够十分完整的复现物体表面的真实纹理,纹理指的是物体表面的花纹。OpenGL库中集合了对于物体纹理的映射处理方式。 OpenCV移动目标物体的检测跟踪的研究(11):http://www.youerw.com/jisuanji/lunwen_524.html