(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210495891.7
(22)申请日 2022.05.09
(71)申请人 武汉纺织大 学
地址 430073 湖北省武汉市洪山区纺织路
一号
(72)发明人 邓在辉 徐华 罗瑞奇 同小军
徐杰
(74)专利代理 机构 武汉泰山北斗专利代理事务
所(特殊普通 合伙) 42250
专利代理师 程千慧
(51)Int.Cl.
G06V 20/52(2022.01)
G06V 10/80(2022.01)
G06K 9/62(2022.01)
G06N 3/04(2006.01)G06N 3/08(2006.01)
(54)发明名称
一种基于改进的YOLOv5模型的安全帽检测
算法
(57)摘要
本发明涉及一种基于改进的YOLOv5模型的
安全帽检测算法, 本发明引入注意力机制的思
想, 将其与特征点的描述方式相结合, 抓取更有
效的信息, 从而提升描述符的鲁棒性; 通过k ‑
means++算法在三个不同尺度上聚类生成锚框作
为模型的初始 框并在模型中加入ARM, 再通过BFF
将ARM与YOLOv5主干网络链接起来, 加上FSM和
DRH使其能够动态的进行预测, 更好的锁定目标,
采用WBF算法, 通过加权框融合得到最终的候选
框, 提升目标检测精度; 采用加速模型提升模型
的检测性能; 本发明提升了小尺 寸目标检测的精
度, 降低了漏检误检的概率, 满足实时检测的需
求, 图片数据背景复杂等情况下, 精度也能保证,
更加贴近实际的应用场景。
权利要求书2页 说明书5页 附图5页
CN 114581860 A
2022.06.03
CN 114581860 A
1.一种基于改进的YOLOv5模型的安全帽 检测算法, 其特 征在于, 包括以下步骤:
步骤1、 收集施工场所安全帽佩戴图像, 按比例分为训练集和测试集, 对训练集中图片
上的安全帽进行手动标注;
步骤2、 对训练集图片进行增强, 从而对训练集进行扩充, 得到扩充后的训练集;
步骤3、 从扩充后的训练集中随取选取一张图片并输入安全帽检测网络的初步特征提
取模块, 初步特征提取模块对图片上 的安全帽对 象进行特征提取, 并对提取特征进行动态
调整, 得到不同尺度的特 征图, 对不同尺度的特 征图进行 特征融合, 得到融合后的特 征图;
步骤4、 将融合后的特征图输入安全帽检测网络的动态注意力 机制模块, 通过对特征图
的各个通道的自主 学习, 辨别各个通道的重要程度, 主动增强不同通道的权重值, 并进行通
道特征融合, 得到通道融合后的特征图, 对通道融合后的特征图进行标记得到调整后的先
验框;
步骤5、 将步骤4得到的标记了调 整后先验框的特征图输入安全帽检测网络的卷积模块
进行训练, 对先验框进行进一 步筛选, 保留的先验框为建议框, 得到标注建议框的图片;
步骤6、 将步骤5得到的标注建议框图片输入安全帽检测网络中的回归和分类模块中,
采用WBF算法为建议框设置不同的权重, 按权重对每个安全帽对象对应的所有建议框进行
加权融合, 得到每 个安全帽对象对应的最终候选 框, 迭代次数加1;
步骤7、 将最终候选框与手动标注结果进行对比, 计算损失函数, 若损 失函数达到最小
值或迭代次数达 到最大迭代次数, 转到下一 步, 否则转到步骤3; 安全帽 检测模型;
步骤8、 得到训练后的安全帽检测模型, 将步骤1中的测试集输入安全帽检测网络模型
中, 输出标注有安全帽的图像。
2.根据权利 要求1所述的基于改进的YOLOv5模型的安全帽检测算法, 其特征在于, 所述
步骤2中对训练集进行扩充的方法包括以下步骤:
步骤2.1、 对训练集的图像进行数据增强后, 随机选取9张图片, 进行缩放、 旋转再随机
拼接组成一张图片, 将拼接后的图片加入训练集;
步骤2.2、 多次重复步骤2.1, 得到扩充后的训练集;
根据权利 要求2所述的基于改进的YOLOv5模型的安全帽检测算法, 其特征在于, 所述步
骤2.1中的数据增强具体为: 采用Mascio数据增强方法, 通过利用调整图片色相、 调整图片
曝光量、 调整图片饱和度或增加图片模糊方式进行数据增强, 再将任意选取的9张图片, 经
过随机拼接过后, 在沿外围进行裁 剪, 得到拼接后的图片。
3.根据权利要求1所述的基于改进 的YOLOv5模型的安全帽检测算法, 其特征在于, 所
述步骤3具体为: 通过k ‑means++算法在三个不同尺度上分别聚类生 成三个锚框作为模 型的
初始框, 然后通过ARM过滤掉初始框中的负样本,再根据真实值对过滤后的初始框进行调
整, FSM的特征选择模块利用多个不同尺寸的RCLs对调整后的初始框进 行特征提取, 得到三
个不同尺寸的特征图, 最后BFF再对三个不同尺寸的特征图上对应点进 行微调, 得到最 终的
三个不同尺度的特 征图。
4.根据权利要求1所述的基于改进 的YOLOv5模型的安全帽检测算法, 其特征在于, 所
述步骤4具体包括以下步骤:
步骤4.1、 对特征图进行全局平局池化, 识别全局最大点来指示检测目标的特征信息,
得到全局特 征;权 利 要 求 书 1/2 页
2
CN 114581860 A
2步骤4.2、 对全局特征进行Excitation操作, 学习各个通道间的关系, 得到每个通道的
权重;
步骤4.3、 将每个通道的权重乘以对应特征图得到每个通道的最终特征, 将所有通道的
最终特征进行加 和得到融合后的特 征图。
5.根据权利 要求1所述的基于改进的YOLOv5模型的安全帽检测算法, 其特征在于, 所述
步骤5中, WBF算法运行期间利用内卷算子进行加速 。
6.根据权利 要求1所述的基于改进的YOLOv5模型的安全帽检测算法, 其特征在于, 所述
步骤6中的采用WBF算法为建议框 设置不同的权重, 通过对每个安全帽对象对应的所有建议
框进行加权融合, 得到每 个对象对应的最终候选 框的方法具体包括以下步骤:
步骤6.1、 计算所有建议框的置信度, 仅保留置信度大于预设阈值的建议框;
步骤6.2、 将对应同一个对象的 T个建议框进行融合, 得到每个对象的最终融合框, 融合
T个建议框时采用如下公式:
其中, (X1,2, Y1,2) 为融合后的建议框的坐标, ( X1i,2i,Y1i,2i) 为建议框 i的坐标,Ci为建议
框i的置信度, C为融合后的建议框 置信度,i∈ (1, 2,…,T) 。权 利 要 求 书 2/2 页
3
CN 114581860 A
3
专利 一种基于改进的YOLOv5模型的安全帽检测算法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 06:57:50上传分享