专利一种基于改进的YOLOv5模型的安全帽检测算法 -在线下载 -AI解读-xawkw.top

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210495891.7 (22)申请日 2022.05.09 (71)申请人武汉纺织大学地址 430073 湖北省武汉市洪山区纺织路一号 (72)发明人邓在辉　徐华　罗瑞奇　同小军　徐杰　 (74)专利代理机构武汉泰山北斗专利代理事务所(特殊普通合伙) 42250 专利代理师程千慧 (51)Int.Cl. G06V 20/52(2022.01) G06V 10/80(2022.01) G06K 9/62(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称一种基于改进的YOLOv5模型的安全帽检测算法 (57)摘要本发明涉及一种基于改进的YOLOv5模型的安全帽检测算法，本发明引入注意力机制的思想，将其与特征点的描述方式相结合，抓取更有效的信息，从而提升描述符的鲁棒性；通过k ‑ means++算法在三个不同尺度上聚类生成锚框作为模型的初始框并在模型中加入ARM，再通过BFF 将ARM与YOLOv5主干网络链接起来，加上FSM和 DRH使其能够动态的进行预测，更好的锁定目标，采用WBF算法，通过加权框融合得到最终的候选框，提升目标检测精度；采用加速模型提升模型的检测性能；本发明提升了小尺寸目标检测的精度，降低了漏检误检的概率，满足实时检测的需求，图片数据背景复杂等情况下，精度也能保证，更加贴近实际的应用场景。权利要求书2页说明书5页附图5页 CN 114581860 A 2022.06.03 CN 114581860 A 1.一种基于改进的YOLOv5模型的安全帽检测算法，其特征在于，包括以下步骤：步骤1、收集施工场所安全帽佩戴图像，按比例分为训练集和测试集，对训练集中图片上的安全帽进行手动标注；步骤2、对训练集图片进行增强，从而对训练集进行扩充，得到扩充后的训练集；步骤3、从扩充后的训练集中随取选取一张图片并输入安全帽检测网络的初步特征提取模块，初步特征提取模块对图片上的安全帽对象进行特征提取，并对提取特征进行动态调整，得到不同尺度的特征图，对不同尺度的特征图进行特征融合，得到融合后的特征图；步骤4、将融合后的特征图输入安全帽检测网络的动态注意力机制模块，通过对特征图的各个通道的自主学习，辨别各个通道的重要程度，主动增强不同通道的权重值，并进行通道特征融合，得到通道融合后的特征图，对通道融合后的特征图进行标记得到调整后的先验框；步骤5、将步骤4得到的标记了调整后先验框的特征图输入安全帽检测网络的卷积模块进行训练，对先验框进行进一步筛选，保留的先验框为建议框，得到标注建议框的图片；步骤6、将步骤5得到的标注建议框图片输入安全帽检测网络中的回归和分类模块中，采用WBF算法为建议框设置不同的权重，按权重对每个安全帽对象对应的所有建议框进行加权融合，得到每个安全帽对象对应的最终候选框，迭代次数加1；步骤7、将最终候选框与手动标注结果进行对比，计算损失函数，若损失函数达到最小值或迭代次数达到最大迭代次数，转到下一步，否则转到步骤3；安全帽检测模型；步骤8、得到训练后的安全帽检测模型，将步骤1中的测试集输入安全帽检测网络模型中，输出标注有安全帽的图像。 2.根据权利要求1所述的基于改进的YOLOv5模型的安全帽检测算法，其特征在于，所述步骤2中对训练集进行扩充的方法包括以下步骤：步骤2.1、对训练集的图像进行数据增强后，随机选取9张图片，进行缩放、旋转再随机拼接组成一张图片，将拼接后的图片加入训练集；步骤2.2、多次重复步骤2.1，得到扩充后的训练集；根据权利要求2所述的基于改进的YOLOv5模型的安全帽检测算法，其特征在于，所述步骤2.1中的数据增强具体为：采用Mascio数据增强方法，通过利用调整图片色相、调整图片曝光量、调整图片饱和度或增加图片模糊方式进行数据增强，再将任意选取的9张图片，经过随机拼接过后，在沿外围进行裁剪，得到拼接后的图片。 3.根据权利要求1所述的基于改进的YOLOv5模型的安全帽检测算法，其特征在于，所述步骤3具体为：通过k ‑means++算法在三个不同尺度上分别聚类生成三个锚框作为模型的初始框，然后通过ARM过滤掉初始框中的负样本,再根据真实值对过滤后的初始框进行调整， FSM的特征选择模块利用多个不同尺寸的RCLs对调整后的初始框进行特征提取，得到三个不同尺寸的特征图，最后BFF再对三个不同尺寸的特征图上对应点进行微调，得到最终的三个不同尺度的特征图。 4.根据权利要求1所述的基于改进的YOLOv5模型的安全帽检测算法，其特征在于，所述步骤4具体包括以下步骤：步骤4.1、对特征图进行全局平局池化，识别全局最大点来指示检测目标的特征信息，得到全局特征；权　利　要　求　书 1/2 页 2 CN 114581860 A 2步骤4.2、对全局特征进行Excitation操作，学习各个通道间的关系，得到每个通道的权重；步骤4.3、将每个通道的权重乘以对应特征图得到每个通道的最终特征，将所有通道的最终特征进行加和得到融合后的特征图。 5.根据权利要求1所述的基于改进的YOLOv5模型的安全帽检测算法，其特征在于，所述步骤5中， WBF算法运行期间利用内卷算子进行加速。 6.根据权利要求1所述的基于改进的YOLOv5模型的安全帽检测算法，其特征在于，所述步骤6中的采用WBF算法为建议框设置不同的权重，通过对每个安全帽对象对应的所有建议框进行加权融合，得到每个对象对应的最终候选框的方法具体包括以下步骤：步骤6.1、计算所有建议框的置信度，仅保留置信度大于预设阈值的建议框；步骤6.2、将对应同一个对象的 T个建议框进行融合，得到每个对象的最终融合框，融合 T个建议框时采用如下公式：其中，（X1,2， Y1,2）为融合后的建议框的坐标，（ X1i,2i，Y1i,2i）为建议框 i的坐标，Ci为建议框i的置信度， C为融合后的建议框置信度，i∈ （1， 2，…，T）。权　利　要　求　书 2/2 页 3 CN 114581860 A 3

专利 一种基于改进的YOLOv5模型的安全帽检测算法

专利一种基于改进的YOLOv5模型的安全帽检测算法