说明:收录全文最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210590089.6 (22)申请日 2022.05.26 (71)申请人 深圳万兴软件 有限公司 地址 518000 广东省深圳市南 山区粤海街 道软件产业基地5 栋D座1001 (72)发明人 焦小珍  (74)专利代理 机构 深圳市精英专利事务所 44242 专利代理师 李珂 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/80(2022.01) G06T 3/40(2006.01) G06N 3/04(2006.01) G06V 10/82(2022.01) (54)发明名称 视频目标的特征提取方法、 装置、 计算机设 备及储存介质 (57)摘要 本申请涉及视频分割技术领域, 揭露一种视 频目标的特征提取方法、 装置、 计算机设备及储 存介质, 其中方法包括获取视频中的当前帧图 像, 并将当前帧图像进行逐层提取特征, 得到第 一至第四分辨率特征图; 将第二 分辨率特征图进 行卷积处理和注意力计算, 得到第二权重特征 图; 将第一分辨率特征图进行卷积处理, 并将第 一卷积特征图与第二卷积特征图特征融合, 将得 到的第一输出特征图与第三分辨率特征图进行 级联处理, 得到第二输出特征图, 并将第四分辨 率特征图作为第三输出特征图; 将 输出特征图进 行下采样处理、 级联处理以及卷积处理, 得到第 一目标特征图、 第二目标特征图以及第三目标特 征图。 本发 明有利于提高视频目标的特征提取效 率。 权利要求书3页 说明书10页 附图5页 CN 114973088 A 2022.08.30 CN 114973088 A 1.一种视频目标的特 征提取方法, 其特 征在于, 包括: 获取视频中的当前帧图像, 并将所述当前帧图像进行逐层提取特征, 依次得到第一分 辨率特征图、 第二分辨 率特征图、 第三分辨 率特征图以及第四分辨 率特征图; 将所述第二分辨率特征图进行卷积处理, 得到第二卷积特征图, 并基于所述第一分辨 率特征图, 对所述第二卷积特 征图进行注意力计算, 得到第二权 重特征图; 将所述第一分辨率特征图进行卷积处理, 得到第一卷积特征图, 并将所述第一卷积特 征图与所述第二权重特征图相乘处理, 得到第一权重特征图, 且将所述第一权重特征图与 所述第二卷积特 征图进行 特征融合, 得到第一输出 特征图; 通过将所述第 一输出特征图与所述第 三分辨率特征图进行级联处理, 得到第 二输出特 征图, 并将所述第四分辨 率特征图作为第三输出 特征图; 基于所述当前帧图像, 将所述第一输出特征图、 所述第二输出特征图以及所述第三输 出特征图进行下采样处理和级联处理, 得到第一基础特征图、 第二基础特征图以及第三基 础特征图; 通过将所述第 一基础特征图、 所述第 二基础特征图以及所述第 三基础特征图分别进行 卷积处理, 得到第一目标 特征图、 第二目标 特征图以及第三目标 特征图。 2.根据权利要求1所述的视频目标的特征提取方法, 其特征在于, 所述将所述第 二分辨 率特征图进 行卷积处理, 得到第二卷积特征图, 并基于所述第一分辨率特征图, 对所述第二 卷积特征图进行注意力计算, 得到第二权 重特征图, 包括: 将所述第二分辨 率特征图进行 卷积处理, 得到所述第二卷积特 征图; 将所述第一分辨 率特征图放大 预设倍数, 得到第一分辨 率特征放大图; 通过将所述第 二卷积特征图与所述第 一分辨率特征放大图进行级联处理, 得到级联处 理结果, 并将所述级联处 理结果进行 卷积处理, 得到第二级联 特征图; 通过对所述第二级联 特征图进行注意力计算, 得到所述第二权 重特征图。 3.根据权利要求2所述的视频目标的特征提取方法, 其特征在于, 所述通过对所述第 二 级联特征图进行注意力计算, 得到所述第二权 重特征图, 包括: 通过对所述第二级联特征图进行平均池化处理, 得到池化后的特征图, 并对所述池化 后的特征图进行 卷积处理, 得到初始权 重特征图; 将所述初始权 重特征图分别进行归一 化处理和激活 处理, 得到所述第二权 重特征图。 4.根据权利要求1所述的视频目标的特征提取方法, 其特征在于, 将所述将所述第 一分 辨率特征图进行卷积处理, 得到第一卷积特征图, 并将所述第一卷积特征图与所述第二权 重特征图相乘处理, 得到第一权重特征图, 且将所述第一权重特征图与所述第二卷积特征 图进行特征融合, 得到第一输出 特征图, 包括: 将所述第一分辨 率特征图进行 卷积处理, 得到所述第一卷积特 征图; 将所述第一卷积特 征图与所述第二权 重特征图相乘处 理, 得到第一权 重特征图; 通过将所述第一权 重特征图放大 预设倍数, 得到第一权 重特征放大图; 基于所述第 二权重特征图的权重信 息, 将所述第 一权重特征放大图与 所述第二卷积特 征图进行 特征融合, 得到第一输出 特征图。 5.根据权利要求4所述的视频目标的特征提取方法, 其特征在于, 所述基于所述第 二权 重特征图的权重信息, 将所述第一权重特征放大图与所述第二卷积特征图进行特征融合,权 利 要 求 书 1/3 页 2 CN 114973088 A 2得到第一输出 特征图, 包括: 基于第二权 重特征图的权 重信息确定第二卷积特 征图的权 重信息; 将所述第一权重特征放大图与所述第 二卷积特征图进行相乘 处理, 得到相乘结果特征 图, 并将所述相乘结果特 征图与所述第二卷积特 征图进行相加处 理, 得到融合特 征图; 对所述融合特 征图进行 卷积处理, 得到所述第一输出 特征图。 6.根据权利要求1所述的视频目标的特征提取方法, 其特征在于, 所述通过将所述第 一 输出特征图与所述第三分辨率特征图进行级联处理, 得到第二输出特征图, 并将所述第四 分辨率特征图作为第三输出 特征图, 包括: 将所述第一输出 特征图放大 预设倍数, 得到第一输出 特征放大图, 将所述第一输出特征放大图与所述所述第 三分辨率特征图进行级联处理, 得到级联结 果; 通过对所述级联结果进行卷积处理, 得到所述第二输出特征图, 并将所述第 四分辨率 特征图作为第三输出 特征图。 7.根据权利要求1所述的视频目标的特征提取方法, 其特征在于, 所述基于所述当前帧 图像, 将所述第一输出特征图、 所述第二输出特征图以及所述第三输出特征图进行下采样 处理和级联处 理, 得到第一基础特 征图、 第二基础特 征图以及第三基础特 征图, 包括: 基于所述当前帧图像, 将所述第一输出特征图、 所述第二输出特征图以及所述第三输 出特征图进行 下采样处 理, 得到第一采样结果、 第二采样结果以及第三采样结果; 将所述第一采样结果与所述第一输出特征图进行级联处理, 得到所述第一基础特征 图; 将所述第二采样结果与所述第二输出特征图进行级联处理, 得到所述第二基础特征 图; 将所述第三采样结果与所述第三输出特征图进行级联处理, 得到所述第三基础特征 图。 8.一种视频目标的特 征提取装置, 其特 征在于, 包括: 特征图提取模块, 用于获取视频中的当前帧图像, 并将所述当前帧图像进行逐层提取 特征, 依次得到第一分辨率特征图、 第二分辨率特征图、 第三分辨率特征图 以及第四分辨率 特征图; 第二权重特征图生成模块, 用于将所述第二分辨率特征图进行卷积处理, 得到第二卷 积特征图, 并基于所述第一分辨率特征图, 对所述第二卷积特征图进 行注意力计算, 得到第 二权重特征图; 第一输出特征图生成模块, 用于将所述第一分辨率特征图进行卷积处理, 得到第一卷 积特征图, 并将所述第一卷积特征图与所述第二权重特征图相乘处理, 得到第一权重特征 图, 且将所述第一权 重特征图与所述第二卷积特 征图进行 特征融合, 得到第一输出 特征图; 第二输出特征图生成模块, 用于通过将所述第 一输出特征图与 所述第三分辨率特征图 进行级联处 理, 得到第二输出 特征图, 并将所述第四分辨 率特征图作为第三输出 特征图; 基础特征图生成模块, 用于基于所述当前帧图像, 将所述第 一输出特征图、 所述第二输 出特征图以及所述第三输出特征图进行下采样处理和级联处理, 得到第一基础特征图、 第 二基础特 征图以及第三基础特 征图;权 利 要 求 书 2/3 页 3 CN 114973088 A 3

.PDF文档 专利 视频目标的特征提取方法、装置、计算机设备及储存介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 视频目标的特征提取方法、装置、计算机设备及储存介质 第 1 页 专利 视频目标的特征提取方法、装置、计算机设备及储存介质 第 2 页 专利 视频目标的特征提取方法、装置、计算机设备及储存介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:51:02上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。