Davision[22]建立著名的全状态扩展卡尔曼滤波器视觉SLAM算法框架。他的系统仅跟踪少量(小于100)角点类似的图像特征,每个特征的深度值通过一个一文的粒子滤波器估计,当深度收敛接近高斯单峰状态时,则将该特征作为路标加入离散地图中。Davision在室内主动视觉SLAM方面做出重要的研究成果,并开辟了单目视觉SLAM研究方向,Davision的方法显示了实时(30帧/秒)和精度高的特点。
1.4 基于视觉的机器人导航定位研究
机器人的导航过程可分成三个阶段:位姿预测、地图匹配(局部地图到全局地图的对应过程)、位姿更新。位姿预测结合环境模型给出机器人的初始位姿,为地图匹配提供一种先验环境特征信息。地图匹配是寻找传感器测量的局部地图信息与全局地图|’白J的对应关系,并用局部地图更新全局地图的过程。最后根据地图匹配结果,应用相关的位姿估计算法完成对机器人定位。目前的定位方法主要有:航位推算法、拓扑表示法、网格表示法、卡尔曼滤波估计、蒙特卡洛法、粒子滤波器估计法。
1.4.1 航位推算法
航位推算法是一种经典的相对位姿估计方法。它一般是应用安装在机器人身上的罩程计或惯性导航传感器(如陀螺仪或加速度计等),通过测量并计算出机器人相对于初始位置的距离和方向来确定机器人的当前位置。航位推算法结构简单、价格低廉,是由机器人自身推断位姿信息,不需外界环境信息,但误差累积大。随行驶距离的增加,累积误差会无限增大,因此只适于短时短距离运动的位姿估计,长时间运动时必须应用其它的传感器配合相关的定位算法进行校正。
1.4.2 拓扑表示法
用拓扑图的定位并不需要精确给定机器人的位姿,而只是需要知道机器人处
于哪一个节点,拓扑法不需要罩程计的测量精度,只是需要确定机器人在该节点
的运动方向。马尔可夫定位[23]已经被很多人成功使用,例如:博物馆导航机器人RHINO就是利用激光数据,使用该方法,但是,这种方法需要使用者提供一个手工导出的拓扑地图,而不能自动地学到地图。Thrun提出了一种使用EM(Epectation-Maximization)算法的用于创建拓扑地图的概率方法[24]。E步骤从基于当前可获取的最好的地图的若干节点中估计机器人的位置,M步骤则估算基于E步骤所计算的机器人位置的最大似然地。Simmon和Koenig[25]应用部分可观察的马尔可夫链模型估计机器人的位置,其马尔可夫模型来自三种信息源:环境的拓扑图、办公环境的先验知识、观测信息。他们在拓扑图的结点间增加距离概念,把每条边分解成由1m×1m的方格连接而成,每个方格分为四种不同的状态,每一状态代表一种可能的运动方向,如东、南、西或北方,连接拓扑结点的走廊建模为马尔可夫链。
1.4.3 网络表示法
环境空间被划分成一系列网格,网格中的每一单元对应于一种可能的机器人位姿或者说是一种可能的状态,网格处的概率值表示机器人位于该网格的可能性大小。与部分可观察马尔可夫模型相似,位置概率网格法的定位过程也分成两步:首先通过罩程计的信息来预测处于某一网格单元的概率值;然后根据传感器在该位姿处所获得的观测值的概率进行更新。受网格法和拓扑法的启发,Burgard等[26]提出了位置概率网格的位姿估计算法。J J Liule,J Lu[27]提出把2D栅格地图与稀疏的3D特征结合起来用于机器人定位,并且平面物体的角点作为稳定的路标,但是路标只用于与下一帧图像匹配,并不一直保持以匹配后来的图像序列,这显然丢失了很多信息从而降低了地图和定位的精度。Li Fyang等[28]提出了一个随机环境模型,它采用定位识别法,易于实现全局定位法。在探测阶段,环境被分割成一些网格,每个网格由一组不随比例变化的关键点来表示。与这些关键点相关的描述符在对比度、比例以及视点变化情况下也可以鲁棒地匹配。利用隐式马尔可夫模型确定一些位置相邻关系,根据这些关系可以消除因坏境动态变化及外观固有模糊性带来的误分类问题。Brown和Donald[29]采用了计算几何中的栅格算法(Rasterized Algorithm)的位姿估计方法:首先他们定义了可行位姿概念,将距离传感器数据与地图匹配时的机器人位姿集合称为有效位姿,否则为无效位姿,并设立误差闽值,用距离矢量的长度变化的误差边界大小来确定机器人位姿的可行区域。 基于视觉的机器人环境建模方法的研究(4):http://www.youerw.com/zidonghua/lunwen_8121.html