专利 视频中对象的检测方法、装置和存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210663384.X (22)申请日 2022.06.13 (71)申请人中国第一汽车股份有限公司地址 130011 吉林省长春市汽车经济技术开发区新红旗大街1号 (72)发明人王宇凡　陈博　尹荣彬　徐名源　邱璆　 (74)专利代理机构北京博浩百睿知识产权代理有限责任公司 1 1134 专利代理师谢湘宁 (51)Int.Cl. G06V 20/40(2022.01) G06V 40/10(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01)G06V 10/82(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称视频中对象的检测方法、装置和存储介质 (57)摘要本发明公开了一种视频中对象的检测方法、装置和存储介质。其中，该方法包括：获取目标视频的第一图像特征，其中，第一图像特征用于表示目标视频中待检测的目标对象；对第一图像特征进行增强处理，得到第二图像特征；对第二图像特征进行卷积处理，得到目标对象的检测结果，其中，检测结果用于表示目标对象的检测精度和方位。本发明解决了对视频中的行人进行检测时，对小尺度行人和被严重遮挡的行人的检测结果低的技术问题。权利要求书2页说明书11页附图5页 CN 115115977 A 2022.09.27 CN 115115977 A 1.一种视频中对象的检测方法，其特征在于，包括：获取目标视频的第一图像特征，其中，所述第一图像特征用于表示所述目标视频中待检测的目标对象；对所述第一图像特征进行增强处理，得到第二图像特征；对所述第二图像特征进行卷积处理，得到所述目标对象的检测结果，其中，所述检测结果用于表示所述目标对象的检测精度和方位。 2.根据权利要求1所述的方法，其特征在于，基于对所述第一图像特征进行增强处理，得到第二图像特征，包括：对所述第一图像特征进行通道增强处理，得到第三图像特征；对所述第三图像特征进行空间增强处理，得到所述第二图像特征。 3.根据权利要求1所述的方法，其特征在于，在获取目标视频的第一图像特征之前，所述方法还包括：采用残差神经网络对每一帧图像的目标对象的第四图像特征进行特征提取，得到序列特征，其中，所述残差神经网络为根据所述第四图像特征训练得到的；所述每一帧图像用于表示所述目标视频的每一帧图像；对所述序列特征进行通道拼接，得到所述第一图像特征。 4.根据权利要求3所述的方法，其特征在于，在采用残差神经网络对每一帧图像的目标对象的第四图像特征进行特征提取，得到序列特征之前，所述方法还包括：对所述目标视频中的多帧图像采用快速卷积神经网络进行处理，得到所述每一帧图像的目标对象的第四图像特征和所述第一帧图像的目标对象的方位数据，其中，所述快速卷积神经网络为根据所述目标视频中的多帧图像训练得到的，所述多帧图像用于表示所述目标视频中的全部帧图像。 5.根据权利要求3所述的方法，其特征在于，在采用残差神经网络对每一帧图像的目标对象的第四图像特征进行特征提取，得到序列特征之前，所述方法还包括：对所述每一帧图像的目标对象的第四图像特征和所述第一帧图像的目标对象的方位数据采用单目标跟踪神经网络进行跟踪处理，得到所述方位对应的所述目标对象的多帧图像特征，其中，所述单目标跟踪神经网络为根据所述每一帧图像的目标对象的图像特征和所述第一帧图像的所述目标对象的方位训练得到的。 6.根据权利要求2所述的方法，其特征在于，基于对所述第一图像特征进行通道增强处理，得到第三图像特征，包括：对所述第一图像特征进行非线性处理，得到通道注意力权重系数，其中，所述通道注意力权重系数为对所述通道增强的程度；对所述通道注意力权重系数与所述第一图像特征进行线性处理，得到所述第三图像特征。 7.根据权利要求2所述的方法，其特征在于，基于对所述第三图像特征进行空间增强处理，得到第二图像特征，包括：对所述第三图像特征进行非线性处理，得到空间注意力权重系数，其中，所述空间注意力权重系数为对所述空间增强的程度；对空间注意力权重系数与所述第三图像特征进行线性处理，得到所述第二图像特征。权　利　要　求　书 1/2 页 2 CN 115115977 A 28.一种视频中对象的检测装置，其特征在于，包括：获取单元，用于获取目标视频的第一图像特征，其中，所述第一图像特征用于表示所述目标视频中待检测的目标对象；第一处理单元，用于对所述第一图像特征进行增强处理，得到第二图像特征；第二处理单元，用于对所述第二图像特征进行卷积处理，得到所述目标对象的检测结果，其中，所述检测结果用于表示所述目标对象的的检测精度和方位。 9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质包括存储的程序，其中，在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求 1至7中任意一项所述的方法。 10.一种车辆，其特征在于，所述车辆用于执行权利要求1至7中任意一项所述一种视频中对象的检测方法。权　利　要　求　书 2/2 页 3 CN 115115977 A 3

专利 视频中对象的检测方法、装置和存储介质

专利视频中对象的检测方法、装置和存储介质