专利 视频属性确定方法、装置、设备及存储介质

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210578444.8 (22)申请日 2022.05.25 (71)申请人腾讯科技（深圳）有限公司地址 518057 广东省深圳市南山区高新区科技中一路腾讯大厦3 5层 (72)发明人胡益珲　岑杰鹏　杨伟东　祁雷　马锴　陈宇　 (74)专利代理机构广州三环专利商标代理有限公司 44202 专利代理师贾允 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01)G06V 10/764(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) G06K 9/62(2022.01) G06F 16/65(2019.01) (54)发明名称视频属性确定方法、装置、设备及存储介质 (57)摘要本申请公开了一种视频属性确定方法、装置、设备及存储介质，可以应用于云技术、人工智能、智慧交通、车联网等各种场景，所述方法包括：获取目标视频的目标视频帧；对所述目标视频帧进行对象特征提取，得到所述目标视频中目标对象的目标图像属性特征；对所述目标视频帧进行场景特征提取，得到所述目标视频的目标场景特征；对所述目标图像属性特征以及所述目标场景特征进行融合处理，得到目标融合特征；根据所述目标融合特征，确定所述目标视频的目标属性信息。本申请提高了确定的属性信息的准确率。权利要求书3页说明书16页附图8页 CN 115131698 A 2022.09.30 CN 115131698 A 1.一种视频属性确定方法，其特征在于，所述方法包括：获取目标视频的目标视频帧；对所述目标视频帧进行对象特征提取，得到所述目标视频中目标对象的目标图像属性特征；对所述目标视频帧进行场景特征提取，得到所述目标视频的目标场景特征；对所述目标图像属性特征以及所述目标场景特征进行融合处理，得到目标融合特征；根据所述目标融合特征，确定所述目标视频的目标属性信息。 2.根据权利要求1所述的方法，其特征在于，所述对所述目标视频帧进行对象特征提取，得到所述目标视频中目标对象的目标图像属性特征，包括：确定所述目标视频中至少两个目标对象各自的结构完整度和清晰度；将结构完整度大于第一阈值且清晰度大于第二阈值的对象，确定为第一目标对象，将所述至少两个目标对象中除所述第一目标对象之外的对象确定为第二目标对象；对所述第一目标对象进行对象特征提取，得到第一目标图像属性特征；对所述第二目标对象进行对象特征提取，得到第二目标图像属性特征；将所述第一目标图像属性特征以及所述第二目标图像属性特征作为所述目标图像属性特征。 3.根据权利要求2所述的方法，其特征在于，所述对所述第二目标对象进行对象特征提取，得到第二目标图像属性特征，包括：对所述第二目标对象进行自重构特征提取，得到目标自重构特征；对所述第二目标对象进行属性描述特征提取，得到目标描述特征；将所述目标自重构特征以及所述目标描述特征，作为所述第二目标图像属性特征。 4.根据权利要求3所述的方法，其特征在于，所述对所述第二目标对象进行自重构特征提取，得到目标自重构特征，包括：基于自重构特征提取模型，对所述第二目标对象进行自重构特征提取，得到所述目标自重构特征。 5.根据权利要求4所述的方法，其特征在于，所述自重构特征提取模型的训练方法包括：将样本视频帧划分成至少两个网格图像；对至少一个网格图像进行图像处理，得到处理后视频帧；所述图像处理包括网格图像的位置更换、网格图像中部分图像的遮挡处理中的至少一种；基于所述处理后视频帧，对第一预设模型进行自重构特征提取训练，得到自重构特征；基于所述自重构特征，对第二预设模型进行图像重构训练，得到重构视频帧；在训练过程中，不断调整第一预设模型的第一模型参数以及第二预设模型的第二模型参数，直至所述第二预设模型输出的重构视频帧与所述样本视频帧相匹配；将当前第一模型参数所对应的第一预设模型，作为所述自重构特征提取模型；所述当前第一模型参数为所述第一预设模型，在所述第二预设模型输出的重构视频帧与所述样本视频帧相匹配时的模型参数。 6.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述目标视频对应的目标音频以及目标文本；权　利　要　求　书 1/3 页 2 CN 115131698 A 2对所述目标音频进行对象特征提取，得到所述目标对象的目标音频属性特征；对所述目标文本进行对象特征提取，得到所述目标对象的目标文本属性特征。 7.根据权利要求6所述的方法，其特征在于，所述对所述目标图像属性特征以及所述目标场景特征进行融合处理，得到目标融合特征，包括：对所述目标图像属性特征、所述目标场景特征、所述目标音频属性特征以及目标文本属性特征进行融合处理，得到所述目标融合特征。 8.根据权利要求7所述的方法，其特征在于，所述对所述目标图像属性特征、所述目标场景特征、所述目标音频属性特征以及目标文本属性特征进行融合处理，得到所述目标融合特征，包括：基于所述目标图像属性特征、所述目标场景特征、所述目标音频属性特征以及目标文本属性特征，确定至少两个待融合特征；对所述至少两个待融合特征进行融合，得到所述目标融合特征。 9.根据权利要求1所述的方法，其特征在于，所述对所述目标视频帧进行对象特征提取，得到所述目标视频中目标对象的目标图像属性特征，包括：对所述目标视频帧进行对象特征提取，得到所述目标视频中目标对象的目标原料特征、目标命名特征以及目标类别特征；所述对所述目标图像属性特征以及所述目标场景特征进行融合处理，得到目标融合特征，包括：对所述目标原料特征、所述目标命名特征、所述目标类别特征以及所述目标场景特征进行融合处理，得到所述目标融合特征；所述根据所述目标融合特征，确定所述目标视频的目标属性信息，包括：根据所述目标融合特征，确定所述目标对象的目标原料信息、目标命名信息以及目标类别信息。 10.根据权利要求1所述的方法，其特征在于，所述对所述目标视频帧进行场景特征提取，得到所述目标视频的目标场景特征，包括：基于所述目标视频帧，确定所述目标对象的至少两个目标关联对象；以所述至少两个目标关联对象各自对应的关联对象特征作为节点，构建有向无环图；所述有向无环图中的边表征所述边对应的两个关联对象特征之间的相似度；基于所述有向无环图进行场景特征提取，得到所述目标场景特征。 11.一种视频属性确定装置，其特征在于，所述装置包括：目标视频帧获取模块，用于获取目标视频的目标视频帧；目标图像属性特征确定模块，用于对所述目标视频帧进行对象特征提取，得到所述目标视频中目标对象的目标图像属性特征；目标场景特征确定模块，用于对所述目标视频帧进行场景特征提取，得到所述目标视频的目标场景特征；目标融合特征确定模块，用于对所述目标图像属性特征以及所述目标场景特征进行融合处理，得到目标融合特征；目标属性信息确定模块，用于根据所述目标融合特征，确定所述目标视频的目标属性信息。权　利　要　求　书 2/3 页 3 CN 115131698 A 3

专利 视频属性确定方法、装置、设备及存储介质

专利视频属性确定方法、装置、设备及存储介质