说明:收录全文最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210578444.8 (22)申请日 2022.05.25 (71)申请人 腾讯科技 (深圳) 有限公司 地址 518057 广东省深圳市南 山区高新区 科技中一路腾讯大厦3 5层 (72)发明人 胡益珲 岑杰鹏 杨伟东 祁雷  马锴 陈宇  (74)专利代理 机构 广州三环 专利商标代理有限 公司 44202 专利代理师 贾允 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06V 10/774(2022.01)G06V 10/764(2022.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06N 20/00(2019.01) G06K 9/62(2022.01) G06F 16/65(2019.01) (54)发明名称 视频属性确定方法、 装置、 设备及存 储介质 (57)摘要 本申请公开了一种视频属性确定方法、 装 置、 设备及存储介质, 可以应用于云技术、 人工智 能、 智慧交通、 车联网等各种场景, 所述方法包 括: 获取目标视频的目标视频帧; 对所述目标视 频帧进行对象特征提取, 得到所述目标视频中目 标对象的目标图像属性特征; 对 所述目标视频帧 进行场景特征提取, 得到所述目标视频的目标场 景特征; 对 所述目标图像属性特征以及所述目标 场景特征进行融合处理, 得到目标融合特征; 根 据所述目标融合特征, 确定所述目标视频的目标 属性信息。 本申请提高了确定的属性信息的准确 率。 权利要求书3页 说明书16页 附图8页 CN 115131698 A 2022.09.30 CN 115131698 A 1.一种视频属性确定方法, 其特 征在于, 所述方法包括: 获取目标视频的目标视频帧; 对所述目标视频帧进行对象特征提取, 得到所述目标视频中目标对象的目标图像属性 特征; 对所述目标视频帧进行场景 特征提取, 得到所述目标视频的目标场景 特征; 对所述目标图像属性特 征以及所述目标场景 特征进行融合处 理, 得到目标融合特 征; 根据所述目标融合特 征, 确定所述目标视频的目标属性信息 。 2.根据权利要求1所述的方法, 其特征在于, 所述对所述目标视频帧进行对象特征提 取, 得到所述目标视频中目标对象的目标图像属性特 征, 包括: 确定所述目标视频中至少两个目标对象各自的结构完整度和清晰度; 将结构完整度大于第一阈值且清晰度大于第二阈值的对象, 确定为第一目标对象, 将 所述至少两个目标对象中除所述第一目标对象之外的对象确定为第二目标对象; 对所述第一目标对象进行对象特 征提取, 得到第一目标图像属性特 征; 对所述第二目标对象进行对象特 征提取, 得到第二目标图像属性特 征; 将所述第一目标图像属性特征以及所述第二目标图像属性特征作为所述目标图像属 性特征。 3.根据权利要求2所述的方法, 其特征在于, 所述对所述第 二目标对象进行对象特征提 取, 得到第二目标图像属性特 征, 包括: 对所述第二目标对象进行自重构特 征提取, 得到目标自重构特 征; 对所述第二目标对象进行属性描述特 征提取, 得到目标描述特 征; 将所述目标自重构特 征以及所述目标描述特 征, 作为所述第二目标图像属性特 征。 4.根据权利要求3所述的方法, 其特征在于, 所述对所述第 二目标对象进行自重构特征 提取, 得到目标自重构特 征, 包括: 基于自重构特征提取模型, 对所述第二目标对象进行自重构特征提取, 得到所述目标 自重构特 征。 5.根据权利要求4所述的方法, 其特征在于, 所述自重构特征提取模型的训练方法包 括: 将样本视频帧划分成至少两个网格图像; 对至少一个网格图像进行图像处理, 得到处理后视频帧; 所述图像处理包括网格图像 的位置更 换、 网格图像中部分图像的遮挡处 理中的至少一种; 基于所述处 理后视频帧, 对第一预设模型进行自重构特 征提取训练, 得到自重构特 征; 基于所述自重构特 征, 对第二预设模型进行图像重构训练, 得到 重构视频帧; 在训练过程中, 不断调整第 一预设模型的第 一模型参数以及第 二预设模型的第 二模型 参数, 直至所述第二预设模型输出的重构视频帧与所述样本 视频帧相匹配; 将当前第一模型参数所对应的第一预设模型, 作为所述自重构特征提取模型; 所述当 前第一模型参数为所述第一预设模型, 在所述第二预设模型输出的重构视频帧与所述样本 视频帧相匹配时的模型参数。 6.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括: 获取所述目标视频对应的目标音频以及目标文本;权 利 要 求 书 1/3 页 2 CN 115131698 A 2对所述目标音频进行对象特 征提取, 得到所述目标对象的目标音频属性特 征; 对所述目标文本进行对象特 征提取, 得到所述目标对象的目标文本属性特 征。 7.根据权利要求6所述的方法, 其特征在于, 所述对所述目标图像属性特征以及所述目 标场景特征进行融合处 理, 得到目标融合特 征, 包括: 对所述目标图像属性特征、 所述目标场景特征、 所述目标音频属性特征以及目标文本 属性特征进行融合处 理, 得到所述目标融合特 征。 8.根据权利要求7所述的方法, 其特征在于, 所述对所述目标图像属性特征、 所述目标 场景特征、 所述目标音频属 性特征以及目标文本属 性特征进行融合处理, 得到所述 目标融 合特征, 包括: 基于所述目标图像属性特征、 所述目标场景特征、 所述目标音频属性特征以及目标文 本属性特 征, 确定至少两个待融合特 征; 对所述至少两个待融合特 征进行融合, 得到所述目标融合特 征。 9.根据权利要求1所述的方法, 其特征在于, 所述对所述目标视频帧进行对象特征提 取, 得到所述目标视频中目标对象的目标图像属性特 征, 包括: 对所述目标视频帧进行对象特征提取, 得到所述目标视频中目标对象的目标原料特 征、 目标命名特 征以及目标类别特 征; 所述对所述目标图像属性特征以及所述目标场景特征进行融合处理, 得到目标融合特 征, 包括: 对所述目标原料特征、 所述目标命名特征、 所述目标类别特征以及所述目标场景特征 进行融合处 理, 得到所述目标融合特 征; 所述根据所述目标融合特 征, 确定所述目标视频的目标属性信息, 包括: 根据所述目标融合特征, 确定所述目标对象的目标原料信息、 目标命名信息以及目标 类别信息。 10.根据权利要求1所述的方法, 其特征在于, 所述对所述目标视频帧进行场景特征提 取, 得到所述目标视频的目标场景 特征, 包括: 基于所述目标视频帧, 确定所述目标对象的至少两个目标关联对象; 以所述至少两个目标关联对象各自对应的关联对象特征作为节点, 构建有向无环图; 所述有向无环图中的边表征 所述边对应的两个关联对象特 征之间的相似度; 基于所述有向无环图进行场景 特征提取, 得到所述目标场景 特征。 11.一种视频属性确定装置, 其特 征在于, 所述装置包括: 目标视频帧获取模块, 用于获取目标视频的目标视频帧; 目标图像属性特征确定模块, 用于对所述目标视频帧进行对象特征提取, 得到所述目 标视频中目标对象的目标图像属性特 征; 目标场景特征确定模块, 用于对所述目标视频帧进行场景特征提取, 得到所述目标视 频的目标场景 特征; 目标融合特征确定模块, 用于对所述目标图像属性特征以及所述目标场景特征进行融 合处理, 得到目标融合特 征; 目标属性信息确定模块, 用于根据所述目标融合特征, 确定所述目标视频的目标属性 信息。权 利 要 求 书 2/3 页 3 CN 115131698 A 3

.PDF文档 专利 视频属性确定方法、装置、设备及存储介质

文档预览
中文文档 28 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 视频属性确定方法、装置、设备及存储介质 第 1 页 专利 视频属性确定方法、装置、设备及存储介质 第 2 页 专利 视频属性确定方法、装置、设备及存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:50:58上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。