说明:收录全文最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210663384.X (22)申请日 2022.06.13 (71)申请人 中国第一汽车股份有限公司 地址 130011 吉林省长 春市汽车 经济技术 开发区新红旗大街1号 (72)发明人 王宇凡 陈博 尹荣彬 徐名源  邱璆  (74)专利代理 机构 北京博浩百 睿知识产权代理 有限责任公司 1 1134 专利代理师 谢湘宁 (51)Int.Cl. G06V 20/40(2022.01) G06V 40/10(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 视频中对象的检测方法、 装置和存 储介质 (57)摘要 本发明公开了一种视频中对象 的检测方法、 装置和存储介质。 其中, 该方法包括: 获取目标视 频的第一图像特征, 其中, 第一图像特征用于表 示目标视频中待检测的目标对象; 对第一图像特 征进行增强处理, 得到第二图像特征; 对第二图 像特征进行卷积处理, 得到目标对象的检测结 果, 其中, 检测结果用于表示目标对象的检测精 度和方位。 本发 明解决了对视频中的行人进行检 测时, 对小尺度行人和被严重遮挡的行人的检测 结果低的技 术问题。 权利要求书2页 说明书11页 附图5页 CN 115115977 A 2022.09.27 CN 115115977 A 1.一种视频中对象的检测方法, 其特 征在于, 包括: 获取目标视频的第一图像特征, 其中, 所述第一图像特征用于表示所述目标视频中待 检测的目标对象; 对所述第一图像特 征进行增强处 理, 得到第二图像特 征; 对所述第 二图像特征进行卷积处理, 得到所述目标对象的检测结果, 其中, 所述检测结 果用于表示所述目标对象的检测精度和方位。 2.根据权利要求1所述的方法, 其特征在于, 基于对所述第一图像特征进行增强处理, 得到第二图像特 征, 包括: 对所述第一图像特 征进行通道增强处 理, 得到第三图像特 征; 对所述第三图像特 征进行空间增强处 理, 得到所述第二图像特 征。 3.根据权利要求1所述的方法, 其特征在于, 在获取目标视频的第一图像特征之前, 所 述方法还 包括: 采用残差神经网络对每一帧图像的目标对象的第四图像特征进行特征提取, 得到序列 特征, 其中, 所述残差神经网络为根据所述第四图像特征训练得到的; 所述每一帧图像用于 表示所述目标视频的每一帧图像; 对所述序列特 征进行通道拼接, 得到所述第一图像特 征。 4.根据权利要求3所述的方法, 其特征在于, 在采用残差神经网络对每一帧图像的目标 对象的第四图像特 征进行特征提取, 得到序列特 征之前, 所述方法还 包括: 对所述目标视频中的多帧图像采用快速卷积神经网络进行处理, 得到所述每一帧图像 的目标对 象的第四图像特征和所述第一帧图像的目标对 象的方位数据, 其中, 所述快速卷 积神经网络为根据所述目标视频中的多帧图像训练得到的, 所述多帧图像用于表示所述目 标视频中的全部帧图像。 5.根据权利要求3所述的方法, 其特征在于, 在采用残差神经网络对每一帧图像的目标 对象的第四图像特 征进行特征提取, 得到序列特 征之前, 所述方法还 包括: 对所述每一帧图像的目标对象的第四图像特征和所述第一帧图像的目标对象的方位 数据采用单目标跟踪神经网络进 行跟踪处理, 得到所述方位对应的所述目标对象的多帧图 像特征, 其中, 所述单目标跟踪神经网络为根据所述每一帧图像的目标对 象的图像特征和 所述第一帧图像的所述目标对象的方位训练得到的。 6.根据权利要求2所述的方法, 其特征在于, 基于对所述第 一图像特征进行通道增强处 理, 得到第三图像特 征, 包括: 对所述第 一图像特征进行非线性处理, 得到通道注意力 权重系数, 其中, 所述通道注意 力权重系数为对所述 通道增强的程度; 对所述通道注意力 权重系数与所述第 一图像特征进行线性处理, 得到所述第 三图像特 征。 7.根据权利要求2所述的方法, 其特征在于, 基于对所述第 三图像特征进行空间增强处 理, 得到第二图像特 征, 包括: 对所述第 三图像特征进行非线性处理, 得到空间注意力 权重系数, 其中, 所述空间注意 力权重系数为对所述空间增强的程度; 对空间注意力权 重系数与所述第三图像特 征进行线性处 理, 得到所述第二图像特 征。权 利 要 求 书 1/2 页 2 CN 115115977 A 28.一种视频中对象的检测装置, 其特 征在于, 包括: 获取单元, 用于获取目标视频的第 一图像特征, 其中, 所述第一图像特征用于表示所述 目标视频中待检测的目标对象; 第一处理单元, 用于对所述第一图像特 征进行增强处 理, 得到第二图像特 征; 第二处理单元, 用于对所述第二图像特征进行卷积处理, 得到所述目标对象的检测结 果, 其中, 所述检测结果用于表示所述目标对象的 的检测精度和方位。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质包括存储的程序, 其中, 在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求 1至7中任意 一项所述的方法。 10.一种车辆, 其特征在于, 所述车辆用于执行权利要求1至7中任意一项所述一种视频 中对象的检测方法。权 利 要 求 书 2/2 页 3 CN 115115977 A 3

.PDF文档 专利 视频中对象的检测方法、装置和存储介质

文档预览
中文文档 19 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共19页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 视频中对象的检测方法、装置和存储介质 第 1 页 专利 视频中对象的检测方法、装置和存储介质 第 2 页 专利 视频中对象的检测方法、装置和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:50:54上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。