kaiyun官方注册
您所在的位置: 首页> 测试测量> 设计应用> 一种基于SIFT特征的铁道检测图片的匹配方法
一种基于SIFT特征的铁道检测图片的匹配方法
2016年微型机与应用第21期
马彦昭,胡浩基,王曰海
浙江大学 信息与电子工程学院,浙江 杭州 310027
摘要:提出一种基于SIFT特征的铁道检测图片的匹配方法。由人工标定铁路上的目标位置图片,通过匹配算法计算匹配图片与目标位置图片可匹配SIFT特征点的数量,利用DTW最优路径规划得到全局最优的匹配结果,从匹配结果中得到一张匹配度最高的图片并将其输出用于道路检测。实验证明,该算法在效率和准确度上均有较好的表现。
关键词: 匹配 铁道 SIFT特征 DTW
Abstract:
Key words :

  马彦昭,胡浩基,王曰海

  (浙江大学 信息与电子工程学院,浙江 杭州 310027)

摘要:提出一种基于SIFT特征铁道检测图片的匹配方法。由人工标定铁路上的目标位置图片,通过匹配算法计算匹配图片与目标位置图片可匹配SIFT特征点的数量,利用DTW最优路径规划得到全局最优的匹配结果,从匹配结果中得到一张匹配度最高的图片并将其输出用于道路检测。实验证明,该算法在效率和准确度上均有较好的表现。

关键词:匹配;铁道;SIFT特征;DTW

0引言

  随着中国铁路技术的发展,对铁道的安全性也提出了更高的要求。为此,相关部门在列车上安装了高帧率的摄像头,并对获得的图片进行人工检测,以发现铁道及其周边环境(如两侧的线杆)是否发生异常变化。然而,由于路程远、帧率高,每辆列车仅仅在两个站点之间获取的图片数量就达到了几万甚至几十万。对于人工检测,无疑需要极高的劳动强度。而事实却是,由于图片之间较高的相似性和连续性,对于每根线杆都会有多张可供检测的冗余的图片,所以在这上万张图片中真正需要用来检测的只有几千张甚至几百张。

  针对铁路检测图片的冗余问题,本文提出了一种降低图片冗余度的方法,在准确度和效率上都有较好的表现。

1流程

  此方法包括了数据选择、尺度不变特征转换(ScaleInvariant Feature Transform,SIFT)特征检测与匹配、动态时间归整(Dynamic Time Warping,DTW)、最佳匹配图片输出四个部分。每一部分具体操作过程将在后文中详细介绍。

2数据选择

  2.1选择目标位置图片

  选择天气良好时两站点之间拍摄的一组图片。按照电线杆标号的顺序,依次从图片中人工选择出一张可清晰看到该线杆的图片。如图1所示,拍摄到线杆‘1220’共有6张图片,从中选择图片d作为目标位置图片(用黑实线标记出)。最终选择的图片数量为M1,图片集设为Aim。

图像 001.png

2.2输入待匹配图片

  在每次的匹配中,使用新得到的具有冗余度的一组图片(设为Match,数量为M2),并保证Match与Aim具有相同的起点和终点。

3SIFT特征检测与匹配

  3.1输入待匹配图片

  SIFT特征是图像的局部特征,其对旋转、尺度缩放、亮度变化保持不变性,对视角变化、仿射变换、噪声也保持一定程度的稳定性[1-2],关于SIFT特征的具体提取与匹配方法,在参考文献[3]中已有详细的说明,此处不再作为重点陈述的对象。

3.2SIFT特征检测与匹配

  分别检测Aim与Match中第i,j张图片的SIFT特征,记为QQ图片20161207143026.pngQQ图片20161207143029.png进行SIFT特征匹配。将匹配的特征点数量记为Ni,j,构成矩阵N。

4DTW动态规划

  4.1DTW算法

  该算法基于动态规划(DP)的思想[4-5],原本是语音识别中的一种算法,用于孤立词识别。此处将其最优路径作为不同图片匹配结果。

4.2DTW最优路径规划

  搜索从N1,1点出发,点(i,j)可达到的前一个格点只可能是(i-1,j),(i-1,j-1)和(i,j-1)。那么(i,j)选择这三个距离中的最大者所对应的点作为其前续格点,设Di,j为(i,j)到(1,1)的累计距离。则:

QQ图片20161207143021.png

  这样从(1,1)点出发(令Di,j=0)搜索,反复递推,直到DM1,M2就可以得到最优路径Road。Roadi,j=1表示路线经过(i,j)点。Roadi,j=0,表示路线未经过。

  对于矩阵Road,若Roadi,j=1,则Matchj与Aimi匹配。

  图2是杭州至德清局部路段拍摄到的963张图片匹配到选定的50张图片的匹配结果。曲线经过的地方表示Roadi,j=1。

图像 002.png

  由图可以得到,对于每一张目标匹配图片,有多张匹配图片与之对应。例如,以上选出的‘1220’线杆,在目标图片中是第38张图片。在匹配图片中标号为771~779这9张图片是与之匹配的结果。如图3所示的a~i的9张图片。

图像 003.png

5最佳匹配图片输出

  已知一张图片Aimi对应于多张图片Matchj。则对于每一个i,找到使Ni,j最大时的j=jmax。将Matchjmax作为最佳的匹配图片输出。如上述找到的‘1220’所匹配的9张图片中,N38,776是N38,771至N38,779中最大的值,则将编号为776的图片,即图3图片f作为最后的匹配结果输出。如图4所示。

图像 004.png

  可以看出,在天气条件不同、拍摄角度和拍摄图片大小不同的情况下,此方法依然能够找到一张最合适的图片用于检测。

  对于每一张图片Aimi,均可以找到一张最佳匹配的图片Matchjmax,将找到的图片作为匹配集合,共有图片M1张。此时,便实现了将原有的数量为M2的图片压缩为数量为M1的图片集合的目的。

6实验结果

  在MATLAB R2014a 环境下,对不同路段图片,在天气不同的条件下进行匹配。同时进行人工验证,检验得到的匹配结果是否可以用于实际的检测中。实验结果如表1所示。

图像 005.png

  实验结果证明:该匹配方法取得了较好的效果,输出的匹配图片可以满足人工检测的需求。

7结束语

  本文提出了一种基于SIFT特征的铁道检测图片的匹配方法,具有准确、高效率和极大降低人工劳动强度的优点。同时此方法对环境、拍摄角度、拍摄器材和天气的依赖较小,具有较好的鲁棒性,可适用于多种场合。

  SIFT特征提取与匹配需要较大的计算量,是日后继续深入研究的重点。即考虑根据实际应用环境,通过一定的约束条件,降低计算量,以提高计算的速度,使此方法具备更强的实际应用能力。

参考文献

  [1] BROWN M, LOWE D G. Invariant features from interest point groups[C]. InBritish Machine Vision Conference,Cardiff, Wales, 2002:656-665.

  [2] 官云兰,张红军,刘向美. 点特征提取算法探讨[J].东华理工学院学报,2007,30(1):42-46.

  [3] DAVID G L. Distinctive image features from scaleinvariant keypoints[J].International Journal of Computer Vision, 2004,60(2):91-110.

  [4] KIM C,SEO K D. Robust DTWbased recognition algorithm for hand—held consumer devices[J].IEEE Transactions on Consumer Electronics,2005,51(2):699-709.

  [5] 赵力.语音信号处理[M].北京:清华大学出版社,2004.

  [6] LeCUN Y A, BOTTOU L, ORR G B, et al. Efficient backprop[C]. Neural Networks: Tricks of the Trade. Springer, 1998, 7:9-48.

  [7] LIU C, YUEN J, TORRALBA A.Sift flow: Dense correspondence across scenes and its applications[J]. Pattern Analysisand Machine Intelligence, IEEE Transactions on,2011,33(5):978-994.


此内容为AET网站原创,未经授权禁止转载。
Baidu
map