中文引用格式: 何兆蓉,郭健,徐琦,等. 基于改进Mask R-CNN的非结构环境小目标语义分割算法[J]. 电子技术应用,2024,50(10):76-81.
英文引用格式: He Zhaorong,Guo Jian,Xu Qi,et al. Small target semantic segmentation algorithm for unstructured environment based on improved Mask R-CNN[J]. Application of Electronic Technique,2024,50(10):76-81.
引言
随着计算机技术的持续进步,传统的语义分割算法对于大规模的对象检测网络模型具有很高的识别精度,但是,这些算法在识别小目标对象时面临着不少的挑战,如存在错误识别或者由于候选框之间相互重叠而无法识别的相关问题。在非结构环境中,处理零部件的数据存在许多挑战,如缺陷样本的数量较少、状态特征存在显著差异、特征粒度差异性较小等。传统的语义分割方法检测的性能比较容易受到环境因素的影响,如照明强度、场景遮挡等,从而导致检测的准确性较低、适应能力较弱。深度学习卷积神经网络具有许多优势,包括强大的泛化能力、高检测准确性以及对环境照明变化的抵抗力强等,因此,深度学习卷积神经网络已经被引入整合到小目标零件的检测中。
在复杂环境下针对小目标的语义分割研究中,魏永超等[1]提出了一种基于Mask R-CNN 算法的改进算法,以解决对缺陷类型的有限和对非结构化环境中对小目标缺陷的语义分割效果差强人意的问题。通过添加SENet模块并改善NMS算法,使新模型的准确性得到了显著提高。文韬[2]解决了传统Mask R-CNN中小目标对象的低识别率的问题,并使用GFPN作为Mask R-CNN模型的功能采集。该模型通过融合从GFPN获得的特征来设置各种特征的权重。苟军年等[3]解决了复杂背景、小像素目标以及Mask R-CNN模型对于传输电路中绝缘子缺陷检测不充分的问题。将卷积注意力模块(Convolutional Block Attention Module, CBAM)引入特征提取网络中,以达到从空间和通道角度提高小目标的特征保留。
本文以空间卫星作为非结构环境的实验场景,以卫星帆板展开机构的爆炸螺栓作为待检测的小目标物体。卫星帆板展开异常是空间卫星故障中最常见的形式之一,造成这种故障的原因主要是爆炸螺栓未完全。此时解决故障的方式一般是通过识别未完全爆炸或未爆炸的螺栓进行补充剪切操作。针对卫星帆板的维修任务,首先需要检测并识别出空间卫星中的一些目标物体,如卫星帆板的反光板面以及未完全爆炸的螺栓等。
针对小目标零件的语义分割研究,程敦诚等[4]使用U-net8将螺母、螺杆和其他信息标记成为不同颜色,并对其图片进行语义分割,以检测螺栓是否处于正常的状态。罗隆福等[5]提出一种基于深度学习的螺栓裂纹检测方法,该方法使用DeepLab v3 plus 算法在螺栓上执行语义分割。李红卫等[6]利用深度学习框架Mask R-CNN[7]智能分析了通过机械臂视觉传感器获得的视觉信息,并根据RGB图像数据实现了小目标零部件的语义分割。
本文在上述研究的基础上,结合卫星帆板中爆炸螺栓的结构特征,提出了一种基于注意力机制的Mask R-CNN语义分割优化算法,在改进模型中完成对爆炸螺栓的语义分割,并与原Mask R-CNN的网络模型进行性能对比,改进后模型优势显著。
本文详细内容请下载:
https://www.chinaaet.com/resource/share/2000006182
作者信息:
何兆蓉,郭健,徐琦,韩锐
(南京理工大学 自动化学院,江苏 南京 210094)