说明:收录全文最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211280557.6 (22)申请日 2022.10.19 (71)申请人 中国农业银行股份有限公司 地址 100005 北京市东城区建国门内大街 69号 (72)发明人 谢莲铭  (74)专利代理 机构 北京品源专利代理有限公司 11332 专利代理师 王瑞云 (51)Int.Cl. G06V 20/70(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 一种场景识别方法、 装置、 设备和存 储介质 (57)摘要 本发明公开了一种场景识别方法、 装置、 设 备和存储介质, 该方法包括: 获取待识别场景对 应的待识别图像; 将所述待识别图像输入预先训 练好的场景识别模型中, 以使所述场景识别模型 基于Stem结构、 第一Inc eption结构、 至少一个第 二Inception结构和全局平均池化层依次对所述 待识别图像进行处理, 得到所述待识别图像对应 的目标特征信息, 并基于全 连接层对 所述目标特 征信息进行分类, 得到所述待识别图像的预测分 类; 根据所述待识别图像的预测分类确定所述待 识别场景的场景识别结果。 上述技术方案, 实现 根据参数量较少的预先训练好的场景识别模型 确定待识别场景对应的待识别图像的预测分类, 并根据待识别图像的预测分类确定待识别场景 的场景识别结果, 提升场景识别效率。 权利要求书2页 说明书13页 附图7页 CN 115439848 A 2022.12.06 CN 115439848 A 1.一种场景识别方法, 其特 征在于, 包括: 获取待识别场景对应的待识别图像; 将所述待识别图像输入预先训练好的场景识别模型中, 以使所述场景识别模型基于 Stem结构、 第一Inception结构、 至少一个第二Inception结构和全局平均池化层依次对所 述待识别图像进行处理, 得到所述待识别图像对应的目标特征信息, 并基于全连接层对所 述目标特征信息进行分类, 得到所述待识别图像的预测分类; 根据所述待识别图像的预测分类确定所述待识别场景的场景识别结果。 2.根据权利要求1所述的场景识别方法, 其特征在于, 所述场景识别 模型基于Stem结构 对所述待识别图像进行处 理, 包括: 将所述待识别图像输入所述Stem结构, 以使所述Stem结构基于三个步长为2的3 ×3卷 积核的卷积层、 三个步长为1的3 ×3卷积核的卷积层、 一个步长为1的1 ×1卷积核的卷积层 对所述待识别图像进行处理, 以减小所述待识别图像的宽度和高度, 增加所述待识别图像 的通道数, 得到所述待识别图像对应的第一特 征信息。 3.根据权利要求2所述的场景识别方法, 其特征在于, 所述场景识别模型基于第一 Inception结构对所述待识别图像进行处 理, 包括: 将所述第一特征信息输入所述第一Inception结构, 以使所述第一Inception结构基于 1×1卷积核的卷积层对所述第一特 征信息进行第一尺寸的特 征提取, 得到第一中间特 征; 基于1×1卷积核的卷积层、 5 ×1卷积核的卷积层和1 ×5卷积核的卷积层对所述第一特 征信息进行第二尺寸的特 征提取, 得到第二中间特 征; 基于1×1卷积核的卷积层、 3 ×3卷积核的卷积层、 3 ×1卷积核的卷积层和1 ×3卷积核 的卷积层对所述第一特 征信息进行第二尺寸的特 征提取, 得到第三中间特 征; 基于3×3卷积核的最大池化层和1 ×1卷积核的卷积层对所述第一特征信息进行第一 尺寸的特 征提取, 得到第四中间特 征; 融合所述第一中间特征、 所述第二中间特征、 所述第三中间特征和所述第 四中间特征 得到所述待识别图像对应的第二特 征信息。 4.根据权利要求3所述的场景识别方法, 其特征在于, 所述场景识别模型基于第二 Inception结构对所述待识别图像进行处 理, 包括: 将所述第二特征信息输入所述第二Inception结构, 以使所述第二Inception结构基于 1×1卷积核的卷积层对所述第二特 征信息进行第一尺寸的特 征提取, 得到第五中间特 征; 基于1×1卷积核的卷积层、 3 ×1卷积核的卷积层和1 ×3卷积核的卷积层对所述第二特 征信息进行第三尺寸的特 征提取, 得到第六中间特 征; 基于1×1卷积核的卷积层、 7 ×1卷积核的卷积层和1 ×7卷积核的卷积层对所述第二特 征信息进行第四尺寸的特 征提取, 得到第七中间特 征; 融合所述第五中间特征、 所述第六中间特征、 所述第七中间特征和所述第二特征信息 得到所述待识别图像对应的第三特 征信息。 5.根据权利要求4所述的场景识别方法, 其特征在于, 所述场景识别模型基于全局 平均 池化层对所述待识别图像进行处 理, 包括: 将所述第三特征信 息输入所述全局 平均池化层, 以使所述全局 平均池化层对所述第 三 特征信息进行平均池化操作, 得到所述待识别图像对应的目标 特征信息。权 利 要 求 书 1/2 页 2 CN 115439848 A 26.根据权利要求5所述的场景识别方法, 其特征在于, 所述场景识别模型所包含的所述 Stem结构中的三个步长为2的3 ×3卷积核的卷积层、 三个步长为1的3 ×3卷积核的卷积层、 一个步长为1的1 ×1卷积核的卷积层, 所包含的所述第一Inception结构中的1 ×1卷积核的 卷积层、 5 ×1卷积核的卷积层、 1 ×5卷积核的卷积层、 3 ×3卷积核的卷积层、 3 ×1卷积核的 卷积层和1 ×3卷积核的卷积层, 所包含的第二Inception结构中的1 ×1卷积核的卷积层、 3 ×1卷积核的卷积层、 1 ×3卷积核的卷积层、 7 ×1卷积核的卷积层和1 ×7卷积核的卷积层均 为深度可分离卷积层。 7.根据权利要求1所述的场景识别方法, 其特征在于, 根据 所述待识别图像的预测分类 确定所述待识别场景的场景识别结果, 包括: 根据所述待识别图像的预测分类确定所述待识别场景的场景类型或者 位置信息 。 8.一种场景识别装置, 其特 征在于, 包括: 获取模块, 用于获取待识别场景对应的待识别图像; 处理模块, 用于将所述待识别图像输入预先训练好的场景识别模型中, 以使所述场景 识别模型基于Stem结构、 第一Inception结构、 至少一个第二Inception结构和全局平均池 化层依次对所述待识别图像进行处理, 得到所述待识别图像对应的目标特征信息, 并基于 全连接层对所述目标 特征信息进行分类, 得到所述待识别图像的预测分类; 确定模块, 用于根据所述待识别图像的预测分类确定所述待识别场景的场景识别结 果。 9.一种计算机设备, 其特 征在于, 所述计算机设备包括: 至少一个处 理器; 以及与所述至少一个处 理器通信连接的存 储器; 其中, 所述存储器存储有可被所述至少一个处理器执行的计算机程序, 所述计算机程 序被所述至少一个处理器执行, 以使所述至少一个处理器能够执行权利要求1 ‑7中任一项 所述的场景识别方法。 10.一种包含计算机可执行指令的存储介质, 所述计算机可执行指令在由计算机处理 器执行时用于执 行权利要求1 ‑7中任一所述的场景识别方法。权 利 要 求 书 2/2 页 3 CN 115439848 A 3

PDF文档 专利 一种场景识别方法、装置、设备和存储介质

文档预览
中文文档 23 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共23页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种场景识别方法、装置、设备和存储介质 第 1 页 专利 一种场景识别方法、装置、设备和存储介质 第 2 页 专利 一种场景识别方法、装置、设备和存储介质 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:27上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。