文献标识码:A
DOI:10.16157/j.issn.0258-7998.200363
中文引用格式:刘欣,李卫龙,张灿明. 基于边窗滤波和扩张卷积的矿井行人检测[J].电子技术应用,2020,46(10):42-46,50.
英文引用格式:Liu Xin,Li Weilong,Zhang Canming. Mine pedestrian detection based on side-window filter and dilated convolution[J]. Application of Electronic Technique,2020,46(10):42-46,50.
0 引言
数字化矿山是实现智能化、现代化煤炭生产的重要基础,对于煤炭产业的可持续发展有着极为重要的意义。采矿自动化、运输智能化、管理信息化是实现数字化矿山的三项关键技术[1]。实现这些技术的前提是构建智能感知系统,而矿井行人检测系统是实现井下智能调度、安全监测等技术的先决条件[2]。
近些年来,深度学习技术在多个计算机视觉领域迅猛发展[3],并在多个任务上获得了优异的性能,例如人脸检测[4]、物体分拣[5]、缺陷检测[6]。具体到行人检测任务上,R-CNN[7]率先将深度学习技术应用在目标检测任务。在此基础上,Faster R-CNN[8]改进候选框选择机制,完备端对端检测框架。2019年,来自Google Brain的TAN M等研究人员[9]提出了基于自动网络寻优技术的EfficientNet,该模型通过动态调整网络的深度、宽度和分辨率,寻找最优的模型设计,在图像分类、目标检测等多个领域获得先进表现。
图像在构建和传输过程中,常因为外界干扰而导致质量退化。常见的解决方案是采用滤波方法对图像做去噪处理[10]。滤波算法可分成两类:线性滤波和非线性滤波。常见的线性滤波包括盒子滤波、高斯滤波;非线性滤波包括中值滤波、双边滤波等。在深度学习算法中,滤波算法常用于图像预处理、特征提取、边缘获取等。尤其是对于边缘检测,滤波算法基于研究人员对于图像的先验知识,充分地提取图像的边缘信息,实现对兴趣区域的精准定位分割[11]。传统滤波算法受限于滤波核结构和运算机理,虽然可以抑制噪声,但同时会造成边缘信息丢失,对检测模型产生负面影响。近些年来,大量的保边滤波算法被提出,用于保留的更多的边缘信息,例如全变分滤波算法[12]、加权最小二乘滤波[13]和导向滤波[14]等。
对于矿井环境,构建行人检测模型需要考虑多个特定的环境因素,包括监控设备所处环境光线不足、粉尘点多,且捕获图像存在较多干扰信号等硬件设备上的不利因素,又要考虑对多目标、不同尺度的行人目标实现准确检测的要求。针对这些难点,本文从视频图像的处理和检测模型的改进两个角度出发,采用边窗滤波抑制视频图像的干扰信号,在模型网络中引入扩张卷积处理多尺度目标。实验证明模型在矿井数据集上取得了优异的检测性能。本文的主要贡献如下:针对矿井环境存在的多样不利因素,采用边窗滤波抑制视频图像的干扰信号,为行人检测模型提供优质的输入图像;采用先进的EfficientNet作为网络主干,用于提取输入图像的特征,并在网络主干中引入扩张卷积,增大特征的感受野,促使网络在多尺度目标上获得更为优异的检测性能。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003018
作者信息:
刘 欣,李卫龙,张灿明
(安徽省煤炭科学研究院,安徽 合肥230001)