(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210555562.7
(22)申请日 2022.05.20
(71)申请人 湖北工业大 学
地址 430068 湖北省武汉市洪山区南李路
28号
(72)发明人 严灵毓 李可 陈子璇 杨金全
胡思琪 叶宇
(74)专利代理 机构 武汉智权专利代理事务所
(特殊普通 合伙) 42225
专利代理师 罗成
(51)Int.Cl.
G06V 10/771(2022.01)
G06V 10/77(2022.01)
G06V 10/80(2022.01)
G06V 10/82(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
目标检测方法、 装置、 设备及可读存 储介质
(57)摘要
本发明提供一种目标检测方法、 装置、 设备
及可读存储介质, 目标检测方法包括: 将输入的
图像进行预处理, 得到初始特征图; 将初始特征
图输入到 预设卷积神经网络中, 基于每一卷积层
在神经网络中所处的位置进行对应的特征提取
操作, 得到每一卷积层输出的特征图; 将预设卷
积层输出的特征图按预设方式进行通道调整, 并
加权融合得到若干目标特征图; 将所述若干目标
特征图按通道维度进行拼接后输入给检测头进
行预设目标的检测, 输出预设目标对应的类别与
位置。 本发 明减少了目标检测过程中冗余特征图
的生成从而减少了模型参数, 加强了底层特征图
的细节信息, 丰富了深层特征图的语义信息, 达
到了特征的有效融合, 提高了目标检测器在定位
和识别物体时的精度。
权利要求书3页 说明书12页 附图3页
CN 114842279 A
2022.08.02
CN 114842279 A
1.一种目标检测方法, 其特 征在于, 所述目标检测方法包括:
将输入的图像进行 预处理, 得到初始特 征图;
将初始特征图输入到预设卷积神经网络 中, 基于每一卷积层在神经网络 中所处的位置
进行对应的特 征提取操作, 得到每一卷积层输出的特 征图;
将预设卷积层输出的特征图按预设方式进行通道调整, 并加权融合得到若干目标特征
图;
将所述若干目标特征图按通道维度进行拼接后输入给检测头进行预设目标的检测, 输
出预设目标对应的类别与位置 。
2.如权利要求1所述的目标检测方法, 其特征在于, 所述基于每一卷积层在神经网络中
所处的位置进行对应的特 征提取操作, 得到每一卷积层输出的特 征图的步骤 包括:
将每一卷积层所输入的特征图按预设卷积方式进行通道维度提升操作, 得到所述卷积
层对应的通道维度提升后的特 征图;
若卷积层处于预设层之前, 则以所述卷积层对应的通道维度提升后的特征图作为所述
卷积层输出的特 征图;
若卷积层处于预设层, 则对所述卷积层对应的通道维度提升后的特征图进行局部特征
提取操作得到第一特征图, 并将第一特征图与所述卷积层 对应的通道维度提升后的特征图
进行相加操作, 得到所述卷积层输出的特 征图;
若卷积层处于预设层之后, 则对所述卷积层对应的通道维度提升后的特征图进行全局
特征提取操作得到第二特征图, 将第二特征图与所述卷积层对应的通道维度提升后的特征
图进行相加操作, 得到所述卷积层输出的特 征图。
3.如权利要求2所述的目标检测方法, 其特征在于, 所述将每一卷积层所输入的特征图
按预设卷积方式进行通道维度提升操作, 得到所述卷积层 对应的通道维度提升后的特征图
的步骤包括:
以每一卷积层所期望 输出的特 征图通道数作为目标通道数;
将每一卷积层输入的特征图输入到第 一特征提取器, 得到所述卷积层对应的第 三特征
图, 所述第一特征提取器包括大小为3 ×3, 个数为第一预设值的卷积核, 所述第一预设值为
所述目标通道数的一半;
将所述卷积层对应的第 三特征图输入到第 二特征提取器, 得到所述卷积层对应的第四
特征图, 所述第一特 征提取器包括大小为1 ×1, 个数为第一预设值的卷积核;
将所述卷积层对应的第 三特征图与第四特征图按通道维度进行拼接, 得到所述卷积层
对应的通道维度提升后的特 征图。
4.如权利要求2所述的目标检测方法, 其特征在于, 所述若卷积层处于预设层, 则对所
述卷积层对应的通道维度提升后的特征图进行局部特征提取操作得到第一特征图的步骤
包括:
若卷积层处于预设层, 则将所述卷积层对应的通道维度提升后的特征图分成大小相同
的预设块特 征图;
对预设块特 征图采用深度分离卷积进行 特征提取操作, 得到新的预设块特 征图;
按照分块前的原始位置对所述新的预设块特征图进行还原, 得到所述卷积层对应的新
的通道维度提升后的特 征图;权 利 要 求 书 1/3 页
2
CN 114842279 A
2将所述卷积层对应的通道维度提升后的特征图与新的通道维度提升后的特征图进行
相加操作, 得到第一特 征图。
5.如权利要求2所述的目标检测方法, 其特征在于, 所述若卷积层处于预设层之后, 则
对所述卷积层对应的通道维度提升后的特征图进行全局特征提取操作得到第二特征图的
步骤包括:
若卷积层处于预设层之后, 则使用线性嵌入函数对所述卷积层对应的通道维度提升后
的特征图进行信息交换, 得到第五特 征图;
基于两个不同的嵌入权重对所述卷积层对应的通道维度提升后的特征图进行权重变
换, 得到第六 特征图与第七特 征图;
对第五特征图、 第六特征图以及第七特征图分别进行维度的转换操作, 得到新的第五
特征图、 新的第六 特征图以及新的第七特 征图;
按照预设函数对新的第六特征图做转置操作后, 与新的第七特征图进行矩阵相乘后做
指数运算, 计算相似性, 得到第八特 征图;
对第八特 征图在最后一个维度上进行归一 化的激活操作, 得到新的第八特 征图;
将新的第八特征图与新的第五特征图进行矩阵相乘后进行维度转换操作, 得到第九特
征图;
利用大小为1 ×1, 个数为第二预设值的卷积核对第九特征图进行通道调整, 得到第十
特征图, 所述第二预设值 为所述卷积层所期望 输出的特 征图通道数;
将所述卷积层对应的通道维度提升后的特征图与第十特征图进行相加操作, 得到第 二
特征图。
6.如权利要求1所述的目标检测方法, 其特征在于, 所述将预设卷积层输出的特征图按
预设方式进行通道调整, 并加权融合得到若干目标 特征图的步骤 包括:
将预设卷积层输出的特征图进行自我拼接操作, 得到通道调整后的特征图, 所述预设
卷积层为预设层以及预设层之后的每一卷积层;
将通道调整后的特 征图以预设方式进行加权融合, 得到若干目标 特征图。
7.一种目标检测装置, 其特 征在于, 所述目标检测装置包括:
预处理模块, 用于将输入的图像进行 预处理, 得到初始特 征图;
特征提取模块, 用于将初始特征图输入到预设卷积神经网络中, 基于每一卷积层在神
经网络中所处的位置进行对应的特 征提取操作, 得到每一卷积层输出的特 征图;
加权融合模块, 用于将预设卷积层输出的特征图按预设方式进行通道调整, 并加权融
合得到若干目标 特征图;
输出模块, 用于将所述若干目标特征图按通道维度进行拼接后输入给检测头进行预设
目标的检测, 输出 预设目标对应的类别与位置 。
8.如权利要求7 所述的目标检测装置, 其特 征在于, 所述特 征提取模块, 具体用于:
将每一卷积层所输入的特征图按预设卷积方式进行通道维度提升操作, 得到所述卷积
层对应的通道维度提升后的特 征图;
若卷积层处于预设层之前, 则以所述卷积层对应的通道维度提升后的特征图作为所述
卷积层输出的特 征图;
若卷积层处于预设层, 则对所述卷积层对应的通道维度提升后的特征图进行局部特征权 利 要 求 书 2/3 页
3
CN 114842279 A
3
专利 目标检测方法、装置、设备及可读存储介质
文档预览
中文文档
19 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 12:50:30上传分享