基于Anchor-free架构的行人检测方法
2020年信息技术与网络安全第4期
张庆伍,关胜晓
(中国科学技术大学 微电子学院,安徽 合肥 230026)
摘要:使用无预选框(Anchor-free)的检测框架,设计了一种行人检测算法。将深度残差网络(ResNet)作为特征提取网络,与特征金字塔网络(FPN)结构相结合,使用了多尺度预测的方式进行预测。把目标中心点和尺寸作为一种高级的语义特征,将含有更多细节信息的浅层特征图和含有更多语义信息的深层特征图进行融合。在Citypersons数据集上进行了实验验证,相较现有行人检测算法,提出的算法在轻微遮挡、一般遮挡和严重遮挡情况下漏检率分别提升了1.11%~3.01%,0.15%~6.55%和0.59%~6.39%,检测效果更好。
中图分类号:TP183
文献标识码:A
DOI:10.19358/j.issn.2096-5133.2020.04.008
引用格式:张庆伍,关胜晓.基于Anchor-free架构的行人检测方法[J].信息技术与网络安全,2020,39(4):43-47,52.
文献标识码:A
DOI:10.19358/j.issn.2096-5133.2020.04.008
引用格式:张庆伍,关胜晓.基于Anchor-free架构的行人检测方法[J].信息技术与网络安全,2020,39(4):43-47,52.
Pedestrian detection algorithms based on Anchor-free architecture
Zhang Qingwu,Guan Shengxiao
(School of Microelectronics,University of Science and Technology of China,Hefei 230026,China)
Abstract:This paper designed a pedestrian detection algorithm based on the Anchor-free detection framework.The deep residual network (ResNet) was used as a feature extraction network,combined with the feature pyramid structure (FPN),and finally multiscale prediction was used for prediction.This paper also regarded the target center point and size as an advanced semantic feature,and combined the shallow feature map with more detailed information and the deep feature map with more semantic information.The experiments were verified on the Citypersons dataset.Compared with the existing pedestrian detection algorithms, the detection results were respectively improved by 1.11%~3.01%, 0.15%~6.55% and 0.59%~6.39% in the case of slight occlusion, general occlusion and severe occlusion, and the detection effect is better.
Key words :Anchor-free;pedestrian detection;feature fusion;multi-scale detection
0 引言
行人检测是智能安防和车辆辅助驾驶等实际应用的关键技术。随着计算机视觉技术的快速发展,目标检测算法的性能也不断提升。目前基于深度学习的目标检测方法按照是否提出预选框可以分为两大类:一类是基于预选框的检测算法,该类算法首先预先设置预选框,然后通过预选框和真实目标进行匹配,最终选出合适的预选框进行训练,这类算法以FasterRCNN和SSD为代表;另一类是不使用预选框的检测算法,该类算法首先对预测目标的关键点进行标注,然后将深度神经网络的输出设置成相同的格式,直接进行训练,这类算法以YOLO和DenseBox为代表。其中,Anchorfree的算法框架结构简洁,更加适用于计算资源较少的实际应用场景。本文在Anchor-free算法的基础上,首先使用不同的基础网络构建检测算法,然后选出性能稳定的基础网络,利用特征金字塔结构对不同卷积层上的特征图进行融合,提升检测效果,最后使用多尺度预测的方法,通过不同尺度的预测图生成了更多的检测结果,再次提升了检测效果。本文算法在Citypersons数据集上进行了验证,其检测精度相较其他行人检测算法有一定提升。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003204
作者信息:
张庆伍,关胜晓
(中国科学技术大学 微电子学院,安徽 合肥 230026)
此内容为AET网站原创,未经授权禁止转载。