早期基于视觉传感技术开发的导航系统中,德国慕尼黑国防军大学的VaMoRs-P系统[2]使用回旋曲线作为简化的道路模型,避免了道路几何复杂的重构问题,提高了系统对阴影的健壮性。但使用的输入源任然是摄像机抓取的原始图像,并未经过任何几何变换,检测过程中需要复杂的公式匹配。当道路不符合模型假设时会出现较严重的偏差,甚至无法正常工作。
相比,后来意大利的GOLD系统[3-4]有着较出色的表现。GOLD系统通过专门的硬件设备进行逆透视投影变换[5],并使用双目立体视觉检测图像变换前后的相关性,由得到的深度图直接判断出障碍物位置,从而实现视觉导航。这套系统能可靠地为车辆提取出道路中障碍物及行道线信息,且具有相当的实时性。但是由于系统中使用双目视觉,对应算法变得十分复杂;同时因为加入专用硬件的设计与配置,成本也略显高昂。对于整套系统而言,涉及领域过于繁复,要如何将它们整合成一个完整的系统也变成一个问题。论文网
对于更为传统的逆透视投影变换则是使用摄像机标定参数,得到图像坐标系与世界坐标系之间关系,再利用公式进行转换[6]。这种方法被广泛应用在各种基于视觉传感的行道线检测技术中。在增加车辆行驶方向信息的基础上,使用定向二维插值逆向求解逆透视投影变换,其精确度与运算速度还能得到较大提升[7]。
1.2 行道线检测过程
然而,对于一套完整的行道线提取方法而言,逆透视投影变换仅是其中的一个处理环节或者说模块。它在检测方法中与前后步骤相衔接,协同工作,通过信息的逐级处理和共享,一同完成整体的检测工作。
逆透视投影变换的前置处理是摄像机标定。根据使用标靶的不同,摄像机标定可分粗略为三维标定法和二维标定法[8]。在早期研究中,根据针孔摄像机模型的几何特征,基于三维标靶的径向标定法首先被提出[9]。这种方法使用放置在世界坐标系中的一组三维标靶提取世界坐标系中的点,然后对摄像机进行标定,因这种方法中一个场景就带有多组世界坐标系中点完整的三维坐标信息,故使用相对简单且具有一定的精度,至今仍被广泛使用[10]。随着对摄像机标定研究的深入,通过对摄像机模型参数进行化简,使用二维标靶也可以对摄像机进行标定[11]。这些方法即可以使用三维标定法中的点与点对应方法[12],也可以使用椭圆曲线进行标定,相比较后者有着更高的标定精度,且过程更为简单明了。总体而言二维标定法比三维标定法更为精确,但是操作方面略显繁复。
相对于前置工作的摄像机标定来说,检测方法中逆透视投影变换的后续工作则显得没有那么单一。首先便是图像处理,逆透视投影变换所得图像,并不是我所希望得到的最终结果,这时候就需要图像处理来把原始图像变成具有我们所希望特征的另一幅图像[13]。其次,对于图像中的行道线信息还应有一个变换、匹配、验证的过程。这是因为图像中不仅仅包括行道线,也包含了诸如行人、标识牌、建筑物等非行道线的物体[14]。如果仅仅是单纯的分离,那么提取出来的信息很可能不是行道线。以这些信息来引导智能车,无疑会造成非常严重的后果。世界上现有的行道线提取方法基本可分为两大类,一种为基于模型的提取方法[15-16],另一种是基于行道线特征的提取方法。基于模型的方法是通过建立道路模型,然后通过模型参数得到行道线。这种方法在实时性上的表现相当不理想。基于行道线特征的方法是通过行道线边缘,纹理等信息来进行提取,但是受道路上光照、气候、阴影的影响,使得行道线提取不准确,或出现错误的识别[17]。