基于边窗滤波和扩张卷积的矿井行人检测-AET-电子技术应用

基于边窗滤波和扩张卷积的矿井行人检测

2020年电子技术应用第10期

刘欣，李卫龙，张灿明

安徽省煤炭科学研究院，安徽合肥230001

摘要： 在数字化矿山中，行人检测系统能够大幅减少事故伤亡，是保护工人安全的重要手段。为了构建高性能的行人检测系统，提出了一种基于边窗滤波和扩张卷积的矿井行人检测模型。具体来说，针对复杂恶劣的矿井环境，采用边窗滤波抑制视频图像中的干扰信号，提升图像质量。此外，考虑到行人目标的多尺度特性，在模型中引入扩张卷积增加特征的感受野，进而提升检测性能。大量的对比实验证明了边窗滤波和扩张卷积的有效性，模型在矿井数据集上获得94.3 mAP和99.1%检测率的优异性能。

关键词： 行人检测边窗滤波扩张卷积深度学习

中图分类号： TN919.8；TP919.8；TP391.41
文献标识码： A
DOI：10.16157/j.issn.0258-7998.200363
中文引用格式： 刘欣，李卫龙，张灿明. 基于边窗滤波和扩张卷积的矿井行人检测[J].电子技术应用，2020，46(10)：42-46，50.
英文引用格式： Liu Xin，Li Weilong，Zhang Canming. Mine pedestrian detection based on side-window filter and dilated convolution[J]. Application of Electronic Technique，2020，46(10)：42-46，50.

Mine pedestrian detection based on side-window filter and dilated convolution

Liu Xin，Li Weilong，Zhang Canming

Anhui Academy of Coal Science，Hefei 230001，China

Abstract： In digitalized mines, pedestrian detection system is able to greatly reduce accident casualties, which is an essential strategy for guaranteeing workers′ well-being. In order to establish mine pedestrian detection system with high performance, a mine pedestrian detection based on side-window filter and dilated convolution is proposed. Specifically, in terms of mines environment with complicated and hostile conditions, side-window filter is adopted to suppress disturbing signals in surveillance pictures, improving image quality. In addition, considering the multi-scale characteristic of pedestrian objects, dilated convolution is introduced into model to increase receptive field of features, thus enhancing detection performance. A number of comparison experiments are conducted to illustrate the effectiveness of side-window filter and dilated convolution, and the model achieves excellent performance of 94.3 mAP and 99.1% of detection accuracy on the mine dataset.

Key words : pedestrian detection；side-window filter；dilated convolution；deep learning

0 引言

数字化矿山是实现智能化、现代化煤炭生产的重要基础，对于煤炭产业的可持续发展有着极为重要的意义。采矿自动化、运输智能化、管理信息化是实现数字化矿山的三项关键技术^[1]。实现这些技术的前提是构建智能感知系统，而矿井行人检测系统是实现井下智能调度、安全监测等技术的先决条件^[2]。

近些年来，深度学习技术在多个计算机视觉领域迅猛发展^[3]，并在多个任务上获得了优异的性能，例如人脸检测^[4]、物体分拣^[5]、缺陷检测^[6]。具体到行人检测任务上，R-CNN^[7]率先将深度学习技术应用在目标检测任务。在此基础上，Faster R-CNN^[8]改进候选框选择机制，完备端对端检测框架。2019年，来自Google Brain的TAN M等研究人员^[9]提出了基于自动网络寻优技术的EfficientNet，该模型通过动态调整网络的深度、宽度和分辨率，寻找最优的模型设计，在图像分类、目标检测等多个领域获得先进表现。

图像在构建和传输过程中，常因为外界干扰而导致质量退化。常见的解决方案是采用滤波方法对图像做去噪处理^[10]。滤波算法可分成两类：线性滤波和非线性滤波。常见的线性滤波包括盒子滤波、高斯滤波；非线性滤波包括中值滤波、双边滤波等。在深度学习算法中，滤波算法常用于图像预处理、特征提取、边缘获取等。尤其是对于边缘检测，滤波算法基于研究人员对于图像的先验知识，充分地提取图像的边缘信息，实现对兴趣区域的精准定位分割^[11]。传统滤波算法受限于滤波核结构和运算机理，虽然可以抑制噪声，但同时会造成边缘信息丢失，对检测模型产生负面影响。近些年来，大量的保边滤波算法被提出，用于保留的更多的边缘信息，例如全变分滤波算法^[12]、加权最小二乘滤波^[13]和导向滤波^[14]等。

对于矿井环境，构建行人检测模型需要考虑多个特定的环境因素，包括监控设备所处环境光线不足、粉尘点多，且捕获图像存在较多干扰信号等硬件设备上的不利因素，又要考虑对多目标、不同尺度的行人目标实现准确检测的要求。针对这些难点，本文从视频图像的处理和检测模型的改进两个角度出发，采用边窗滤波抑制视频图像的干扰信号，在模型网络中引入扩张卷积处理多尺度目标。实验证明模型在矿井数据集上取得了优异的检测性能。本文的主要贡献如下：针对矿井环境存在的多样不利因素，采用边窗滤波抑制视频图像的干扰信号，为行人检测模型提供优质的输入图像；采用先进的EfficientNet作为网络主干，用于提取输入图像的特征，并在网络主干中引入扩张卷积，增大特征的感受野，促使网络在多尺度目标上获得更为优异的检测性能。

本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003018

作者信息:

刘欣，李卫龙，张灿明

(安徽省煤炭科学研究院，安徽合肥230001)

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容