kaiyun官方注册
您所在的位置: 首页> 人工智能> 设计应用> 面向密集行人场景的YOLOv8n改进算法
面向密集行人场景的YOLOv8n改进算法
电子技术应用
王丽黎1,2,樊盼盼1,张诗雨1
1.西安理工大学 自动化与信息工程学院;2.无线光通信与网络研究重点实验室
摘要:为了解决传统算法在密集行人场景中识别精度不足和检测不准确的问题,提出一种基于YOLOv8n的改进型密集行人检测模型。首先,引入SPPELAN模块替换骨干网络中的SPPF模块,以提升模型对多尺度目标的特征感知能力。其次,设计一种残差注意力机制,提高模型对细微特征的提取能力,进而提高检测精度。最后通过添加DySample算子、改进的小目标检测层提高模型对小尺度目标的定位识别能力。实验结果显示,改进的模型相较于YOLOv8n在CrowdHuman数据集上的召回率、mAP50和mAP50-95分别提升了2.5%、2.9%和2.4%,并且该模型在WiderPerson和CityPersons数据集上表现优异。实验结果表明,该算法能更好适用于密集行人检测任务。
中图分类号:TP391.41 文献标志码:A DOI: 10.16157/j.issn.0258-7998.245589
中文引用格式:王丽黎,樊盼盼,张诗雨. 面向密集行人场景的YOLOv8n改进算法[J]. 电子技术应用,2025,51(2):15-20.
英文引用格式:Wang Lili,Fan Panpan,Zhang Shiyu. An improved YOLOv8n algorithm for dense pedestrian scenarios[J]. Application of Electronic Technique,2025,51(2):15-20.
An improved YOLOv8n algorithm for dense pedestrian scenarios
Wang Lili1,2,Fan Panpan1,Zhang Shiyu1
1.School of Automation and Information Engineering, Xi’an University of Technology; 2.Key Laboratory of Wireless Optical Communication and Network Research
Abstract:To address the issues of insufficient recognition accuracy and inaccurate detection of traditional algorithms in dense pedestrian scenarios, an improved dense pedestrian detection model based on YOLOv8n is proposed. Firstly, by introducing the SPPELAN module to replace the SPPF module in the backbone network, the model’s ability to perceive features of multi-scale targets is enhanced. Secondly, a residual attention mechanism is devised to improve the model’s ability to capture subtle features, thereby enhancing detection accuracy. Finally, by adding DySample operator and improving the small object detection layer, the model’s ability to locate and recognize small-scale objects is enhanced. Experimental results show that the improved model, compared to YOLOv8n, increases recall rate, mAP50, and mAP50-95 by 2.5%, 2.9%, and 2.4%, respectively, on the CrowdHuman dataset, and performs excellently on the WiderPerson and CityPersons datasets. The results of the experiments show that this algorithm is more effective for dense pedestrian detection tasks.
Key words :YOLOv8n;dense pedestrian detection;SPPELAN module;residual attention mechanism;DySample;small object detection layer

引言

近年来随着自动驾驶、视频监控系统的高速发展,现实需求对行人检测要求越来越高。传统的行人检测算法根据检测方法的不同,分为双阶段检测算法和单阶段检测算法。常见的双阶段目标检测算法主要包含目标定位和目标分类两个步骤。首先,提取出图像中所有可能包含目标的区域,即目标定位。然后对所提取的每个区域进行分类,确定含有的目标类型。常见算法包括Faster R-CNN[1]、RetinaNet[2]等。单阶段检测算法是直接将从图像中提取的特征进行位置预测和种类识别,常见的单阶段检测算法包括YOLO等。

传统的目标检测算法在大多数现实场景中都取得了不错的效果,但是在一些密集场景中,如大型商场、景区、人流量大的客运站等,算法对行人目标的检测性能仍需要提升,主要原因是密集场景中的行人目标密集且行人尺度不一。

针对密集目标检测中目标数量多、尺寸不一的问题,王泽宇等[3]基于YOLOv8n提出密集行人检测算法MER-YOLO,使用MobileVit作为主干网络提升模型对聚集区域的特征提取能力,之后通过引入高效多尺度注意力(Efficient Multi-scale Attention,EMA)提高全局信息交互能力,采用排斥损失函数作为边界损失函数降低模型的漏检情况。黄昆等[4]基于YOLOv8提出检测算法Crowd-YOLOv8,通过使用nostride-Conv-SPD模块加强网络对细微信息的特征提取能力,并引入小目标检测头和上采样算子对多尺度特征进行融合,增强了小尺度目标检测效果。吕志轩等[5]提出了多分支无锚框行人检测算法MBAN,该算法通过在主干网络后引入多分支网络结构,并结合距离损失函数来对关键区域进行指导,使网络对行人局部检测位置进行差异化学习,强化对行人局部特征的捕捉,改善网络对遮挡行人的识别能力。

为了有效解决上述问题,本文提出了一种基于YOLOv8n模型改进的密集行人检测算法,旨在增强对多尺度行人目标的特征提取能力,加强检测头的定位检测能力,更好识别密集行人目标,提升检测精度。


本文详细内容请下载:

https://www.chinaaet.com/resource/share/2000006319


作者信息:

王丽黎1,2,樊盼盼1,张诗雨1

(1.西安理工大学 自动化与信息工程学院,陕西 西安 710048;

2.无线光通信与网络研究重点实验室,陕西 西安 710048)


Magazine.Subscription.jpg

此内容为AET网站原创,未经授权禁止转载。
Baidu
map