无人驾驶基于不同情况的行人检测与车辆检测
2018-10-16
一.行人检测
基于Stixel模型的行人检测
2012年,比利时研究人员RodrigoBenenson和MarkusMatias在如何快速、有效地进行行人检测方面,提出了两种加速方法。一种是如何在单帧图像上更好地处理尺度信息,另一种是如何利用立体图像的深度信息来加速。在不降低检测质量的前提下,可以获得20倍的加速效果。该方法的检测速度达到100fps。
该方法利用Stixel模型进行目标检测。Stixd为柱状物之类的;特征描述,主要对地平面之上的目标进行建模。对于图片中的每一列而言,可以估算出底部像素、顶部像素以及目标之间的距离。利用深度信息对目标进行检测。Stixel模型在立体图像中能更好地发挥作用,无须计算所有的深度信息,而只需直接快速地利用立体图像来计算。借助于Slixel模型,检测空间缩小了,使实际应用过程中的速度性能变得更好。
2.基于激光雷达与视频数据融合的行人检测
就目前技术来说,视觉虽然可以提供丰富的图像信息,但是室外场景中的光照变化、遮挡、阴影等影响,导致视觉算法在复杂交通环境中鲁棒性较低。由于激光雷达可以获得移动目标在二维平面内的位置、形状等状态估计,因此可以有效地实现移动目标的状态跟踪。通过融合激光雷达与视频图像数据,可以对目标进行较为准确的检测。利用激光雷达数据抽取出感兴趣区域,再利用视频图像识别该目标的属性,可以有效地实现不同模态传感器间的互补,提高检测性能。采用激光雷达与视频数据融合的方法检测车辆周边环境中的行人,一般包括3个步骤:(1) 处理激光雷达数据,得到感兴趣区域;(2) 准备图像数据,进行基于图像的行人检测算法的训练;(3) 利用训练好的分类器,在感兴趣区域内进行行人检测。具体来说,首先是对激光雷达数据进行聚类、分类处理,将处于激光有效范围外的激光点以及可以认为是建筑物、车辆、灌木丛等反射的激光点排除,得到疑似行人反射的激光点。一般将给定激光点所处位置[〇,2.2]m的高度范围看作感兴趣区域;同时,将聚类、分类过程中属于同一物体的激光点用一个方框代替。用训练好的分类器,基于感兴趣区域进行行人检测。基于激光雷达数据提供的感兴趣区域进行行人检测,能够极大地提高检测速度,并大大减少误检率。
二.车辆检测
基于视觉的车辆检测
(1)概述。基于单目视觉的车辆检测方法可分为基于外观(Appearance)的方法和基于运动(Motion)的方法。前者直接从单帧图像中检测车辆,而后者则使用连续帧图像进行检测。单目图像缺乏直接的深度测量,大多使用基于外观的方法。早期的单目视觉车辆检测使用图像中的对称性和边缘特征来进行检测。近年来研究人员采用更通用并具鲁棒性的特征,如HOG特征、Haar-like特征来对车辆进行检测。这些特征可被用来直接对图像中的目标进行分类和检测。
HOG特征是一种解释型(descriptive)的图像特征,可用来确定车辆的姿态。其主要缺点是计算速度慢。近年来,随着GPU的使用,HOG特征的计算瓶颈问题已得到解决,而Haar-lilce特征不仅非常适合于检测水平、垂直、对称的结构,还通过使用积分图可使特征提取加快,因而可用CPU进行实时计算。也有人利用SIFT特征来检测车的尾部,包括有遮挡时的情况。还有研究人员用加速鲁棒特征(Speeded-UpRobustFeatures,SURF)和边缘特征的方法来检测盲区中的车辆。在立体视觉方法中,更常使用基于运动的方法,且多视几何可以测量深度信息。利用立体视觉获取3D坐标,可以区分静态物体和运动物体。与单目方法依赖外观特征和机器学习不同,立体方法更依赖于运动特征、跟踪和滤波。