(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111532944.X
(22)申请日 2021.12.15
(71)申请人 江苏电力 信息技术有限公司
地址 210024 江苏省南京市 鼓楼区北京西
路20号
(72)发明人 施文波 徐然 戴华冠
(74)专利代理 机构 南京汇盛专利商标事务所
(普通合伙) 32238
代理人 陈扬
(51)Int.Cl.
G06V 20/10(2022.01)
G06V 10/44(2022.01)
G06V 10/764(2022.01)
G06V 10/82(2022.01)
G06K 9/62(2022.01)G06N 3/04(2006.01)
G06Q 50/08(2012.01)
G06Q 10/10(2012.01)
(54)发明名称
基于Transformer的安全帽识别方法
(57)摘要
本发明公开了一种基于Tran sformer的安全
帽识别方法, 首先, 提取图像上的特征, 并加入图
像位置信息, 其次, 在经过Tran sformer编码组件
得到注意力特征信息, 并将所得到注 意力特征信
息和目标查询信息输入Transformer解码组件,
输出注意力特征图, 最后, 利用前馈神经网络预
测物体类别和中心坐标、 框图高度、 宽度。 此方法
能够用于智慧工地安全帽检测系统, 快速有效,
方法巧妙, 扩 展性强, 具有良好的应用前 景。
权利要求书2页 说明书4页 附图2页
CN 114387508 A
2022.04.22
CN 114387508 A
1.一种基于Transformer的安全帽识别方法, 其特 征在于, 包括以下步骤:
步骤1, 提取图像上的特 征, 并加入图像相关位置信息;
步骤2, 利用Transformer编码组件得到注意力特 征信息;
步骤3, 将所得到注意力特征信息和目标查询信息输入Transformer解码组件, 输出注
意力特征图;
步骤4, 注意力特征图当成输入, 利用前馈神经网络预测物体类别和中心坐标、 框图高
度、 宽度。
2.根据权利 要求1所述的基于Transformer的安全帽识别方法, 其特征在于, 所述步骤1
包括以下步骤:
步骤1‑1, 将图像上的三维信息
通过卷积神经网络转换成二维 图像
信息
其中H0为图像高, W0为图像宽,
d=512;
步骤1‑2, 通过正弦函数和余弦函数将位置信息嵌入到图像中, 具体的公式如下:
其中, pos表示当前位置, i表示 为维度, dmodel为HW。
3.根据权利 要求1所述的基于Transformer的安全帽识别方法, 其特征在于, 所述步骤2
包括以下步骤:
步骤2‑1, 将输入信息, 通过多头自注意力模块, 得到多头自注意力特 征信息;
步骤2‑2, 进一步地, 对所得信息数据用Softmax归一化, 再做残差连接和标准化, 具体
地公式如下:
其中xi为第i个节点的输出值, j为输出节点个数;
步骤2‑3, 通过前馈神经网络, 更深地挖掘注意力重点信息, 并对结果归一化和残差连
接;
步骤2‑4, 重复6次步骤2 ‑1至2‑3, 得到Transformer编码组件最终输出。
4.根据权利要求3所述的基于Transformer的安全帽识别方法, 其特征在于, 所述步骤
2‑1包括以下步骤:
步骤2‑1‑1, 在上述得到多头自注意力特征图, 是将多头注意力应用于图像信息特征,
具体计算公式如下:
MultiHead(Q, K, V)=Co ncat(head1, ..., headh)Wo
权 利 要 求 书 1/2 页
2
CN 114387508 A
2其中
5.根据权利 要求1所述的基于Transformer的安全帽识别方法, 其特征在于, 所述步骤3
包括以下步骤:
步骤3‑1, Transformer编码组件输出注意力特征信息成为Transformer解码组件多头
注意力中的V, K输入, 目标查询 信息作为Q的输入, 通过多头注 意力模块, 得到多头自注 意力
特征信息, 对 所得信息数据用Softmax归一化, 做残差连接, 再通过前馈神经网络, 并对 结果
归一化和残差连接, 得到第一次输出注意力特 征信息;
步骤3‑2, 重复6次步骤3 ‑1, 其中每一次V, K输入都来自Transformer编码组件输出注意
力特征信息, Q由每一 步骤中上一 步骤的输出注意力特 征信息, 最终得到注意力特 征图。
6.根据权利 要求1所述的基于Transformer的安全帽识别方法, 其特征在于, 所述步骤4
包括: 对自注意力特 征图做前馈神经网络, 分别输出识别目标类别和目标边框位置 。权 利 要 求 书 2/2 页
3
CN 114387508 A
3
专利 基于Transformer的安全帽识别方法
文档预览
中文文档
9 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共9页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-19 04:40:33上传分享