说明:收录全文最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210639497.6 (22)申请日 2022.06.06 (71)申请人 中移 (杭州) 信息技 术有限公司 地址 311100 浙江省杭州市余杭区五常街 道余杭塘路16 00号A01号楼 申请人 中国移动通信集团有限公司 (72)发明人 张健 程宝平 吴楠  (74)专利代理 机构 深圳市世纪恒程知识产权代 理事务所 4 4287 专利代理师 胥巧莉 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/82(2022.01) G06V 10/80(2022.01) G06V 10/774(2022.01)G06V 10/764(2022.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称 视频检测方法、 装置、 设备及计算机可读存 储介质 (57)摘要 本发明公开了一种视频检测方法、 装置、 设 备及计算机可读存储介质, 视频检测方法包括: 获取待测视频的音频信号, 确定所述音频信号的 音频深度特征, 检测所述音 频信号是否为涉黄音 频信号; 若是, 则确定所述待测视频中与所述音 频信号对应的目标视频, 并确定所述目标视频的 视觉深度特征; 根据所述音 频深度特征和所述视 觉深度特征构建融合特征矩阵; 若根据所述融合 特征矩阵确定所述待测视频为存在涉黄的视频, 则确定所述待测视频中的目标涉黄视频内容。 本 发明实现了高效 并且精准的检测涉黄 视频。 权利要求书2页 说明书11页 附图3页 CN 114998800 A 2022.09.02 CN 114998800 A 1.一种视频检测方法, 其特 征在于, 所述视频检测方法包括以下步骤: 获取待测视频的音频信号, 确定所述音频信号的音频深度特征, 检测所述音频信号是 否为涉黄音频信号; 若是, 则确定所述待测视频中与所述音频信号对应的目标视频, 并确定所述目标视频 的视觉深度特 征; 根据所述音频深度特 征和所述视 觉深度特 征构建融合特 征矩阵; 若根据所述融合特征矩阵确定所述待测视频为存在涉黄的视频, 则确定所述待测视频 中的目标 涉黄视频内容。 2.如权利要求1所述的视频检测方法, 其特征在于, 所述若根据 所述融合特征矩阵确定 所述待测视频为存在涉黄的视频, 则确定所述待测视频中的目标涉黄视频片段的步骤, 包 括: 根据所述融合特 征矩阵确定所述目标视频中是否存在涉黄特 征; 若所述目标视频中存在涉黄特征, 则确定所述待测视频为存在涉黄的视频, 并将所述 目标视频划分为多个时长等同的待测视频片段, 并根据各所述待测视频片段确定所述待测 视频中的目标 涉黄视频内容。 3.如权利要求2所述的视频检测方法, 其特征在于, 所述根据各所述待测视频片段确定 所述待测视频中的目标 涉黄视频内容的步骤, 包括: 遍历各所述待测视频片段, 基于所述融合特征矩阵确定遍历的所述待测视频片段中是 否存在所述涉黄特 征; 若遍历的所述待测视频片段中存在所述涉黄特征, 则确定遍历的所述待测视频片段对 应的时间段, 并将所述待测视频中和所述时间段匹配的视频内容作为目标 涉黄视频内容。 4.如权利要求3所述的视频检测方法, 其特征在于, 所述将所述待测视频中和所述 时间 段匹配的视频内容作为目标 涉黄视频内容的步骤之后, 还 包括: 确定所述待测视频中与所述目标视频相邻的相邻 视频, 确定所述相邻 视频中是否存在 具有所述涉黄特 征的视频片段; 若所述相邻 视频中存在具有所述涉黄特征的视频片段, 则将所述待测视频中和所述具 有所述涉黄特 征的视频片段对应的视频内容作为目标 涉黄视频内容。 5.如权利要求1所述的视频检测方法, 其特征在于, 所述根据所述音频深度特征和所述 视觉深度特 征构建融合特 征矩阵的步骤, 包括: 对所述音频深度特 征进行长短期记 忆网络训练, 得到音频训练特 征; 对所述视 觉深度特 征进行所述长短期记 忆网络训练, 得到 视觉训练特 征; 对所述音频训练特 征和所述视 觉训练特 征进行特征提取融合, 得到初步融合特 征; 根据所述初步融合特征和所述音频训练特征构建音频融合特征, 并根据 所述初步融合 特征和所述视 觉训练特 征构建视 觉融合特 征; 根据所述音频融合特 征和所述视 觉训练特 征构建融合特 征矩阵。 6.如权利要求1所述的视频检测方法, 其特征在于, 所述确定所述目标视频的视觉深度 特征的步骤, 包括: 根据所述音频深度特征计算所述目标视频的视觉注意力 权重, 并提取所述目标视频的 初始视觉深度特 征;权 利 要 求 书 1/2 页 2 CN 114998800 A 2根据所述视 觉注意力权 重和所述初始视 觉深度特 征计算视 觉深度特 征。 7.如权利要求1 ‑6任一项所述的视频检测方法, 其特征在于, 所述确定所述音频信号的 音频深度特 征的步骤, 包括: 将所述音频信号转换为音频谱图, 并确定所述音频谱图的深度信息, 根据所述深度信 息提取所述音频谱图中的音频深度特 征。 8.一种视频检测装置, 其特 征在于, 所述视频检测装置包括: 获取单元, 用于获取待测视频的音频信号, 确定所述音频信号的音频深度 特征, 检测所 述音频信号是否为涉黄音频信号; 确定单元, 用于若是, 则确定所述待测视频中与所述音频信号对应的目标视频, 并确定 所述目标视频的视 觉深度特 征; 构建单元, 用于根据所述音频深度特 征和所述视 觉深度特 征构建融合特 征矩阵; 检测单元, 用于若根据所述融合特征矩阵确定所述待测视频为存在涉黄的视频, 则确 定所述待测视频中的目标 涉黄视频内容。 9.一种视频检测设备, 其特征在于, 所述视频检测设备包括: 存储器、 处理器及存储在 所述存储器上并可在所述处理器上运行的视频检测程序, 所述视频检测程序被所述处理器 执行时实现如权利要求1至7中任一项所述的视频检测方法的步骤。 10.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质上存储有视频检 测程序, 所述视频检测程序被处理器执行时实现如权利要求 1至7中任一项所述的视频检测 方法的步骤。权 利 要 求 书 2/2 页 3 CN 114998800 A 3

.PDF文档 专利 视频检测方法、装置、设备及计算机可读存储介质

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 视频检测方法、装置、设备及计算机可读存储介质 第 1 页 专利 视频检测方法、装置、设备及计算机可读存储介质 第 2 页 专利 视频检测方法、装置、设备及计算机可读存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 12:51:00上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。