说明:收录全文最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211274337.2 (22)申请日 2022.10.18 (71)申请人 中国工商银行股份有限公司 地址 100140 北京市西城区复兴门内大街 55号 (72)发明人 刘乙赛 罗涛 施佳子 李艳宇  (74)专利代理 机构 北京康信知识产权代理有限 责任公司 1 1240 专利代理师 黄海英 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/77(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称 图像识别方法、 装置、 计算机可读存储介质 及电子设备 (57)摘要 本发明公开了一种图像识别方法、 装置、 计 算机可读存储介质及电子设备, 涉及人工智能技 术领域。 其中, 该方法包括: 获取至少一个视频 帧, 其中, 视频帧中至少包括待识别图像; 将待识 别图像输入目标识别模型中, 输出多个识别结 果, 其中, 目标识别模型是通过向第一识别模型 中添加目标网络模块得到的, 目标网络模块用于 对第一识别模 型的网络分支进行扩展, 识别结果 表征待识别图像属于该识别结果所对应类别的 概率; 根据多个识别结果确定待识别图像所属的 目标类别, 并在目标类别满足预设条件的情况 下, 确定待识别图像为目标图像, 其中, 目标图像 至少包括目标图形徽标。 本发明解决了现有技术 中的图像识别模型对图形徽标的识别准确度低 的技术问题。 权利要求书2页 说明书10页 附图4页 CN 115471779 A 2022.12.13 CN 115471779 A 1.一种图像识别方法, 其特 征在于, 包括: 获取至少一个视频帧, 其中, 所述视频帧中至少包括待识别图像; 将所述待识别图像输入目标识别模型中, 输出多个识别结果, 其中, 所述目标识别模型 是通过向第一识别模型中添加目标网络模块得到的, 所述目标网络模块用于对所述第一识 别模型的网络 分支进行扩展, 所述识别结果表征所述待识别图像属于该识别结果所对应类 别的概率; 根据多个所述识别结果确定所述待识别图像所属的目标类别, 并在所述目标类别满足 预设条件的情况下, 确定所述待识别图像为目标图像, 其中, 所述目标图像至少包括目标图 形徽标。 2.根据权利要求1所述的方法, 其特 征在于, 通过以下 方法生成所述目标识别模型: 获取目标样本数据集; 根据所述目标样本数据集对初始 识别模型进行训练, 得到训练后的识别模型; 对所述训练后的识别模型的目标层网络结构进行融合处 理, 得到所述目标识别模型。 3.根据权利要求2所述的方法, 其特征在于, 在根据 所述目标样本数据集对初始识别模 型进行训练, 得到训练后的识别模型之前, 所述方法还 包括: 获取所述第 一识别模型, 其中, 所述第一识别模型至少包括反向残差结构, 所述反向残 差结构至少包括残差结构和串联 结构; 在所述残差结构的逐点卷积层与 所述残差结构的深度卷积层之间, 添加第 一网络模块 和第二网络模块, 得到第一目标初始网络模块, 其中, 所述残差结构的深度卷积层的卷积核 尺寸为第一尺寸, 所述第一网络模块由批量归一化层组成, 所述第二网络模块由所述批量 归一化层和卷积核尺寸 为第二尺寸的深度卷积层组成; 在所述串联结构中添加第 三网络模块, 得到第 二目标初始网络模块, 其中, 所述第三网 络模块至少包括第一网络分支和 第二网络 分支, 所述第一网络 分支的深度卷积层的卷积核 尺寸为第三尺寸, 所述第二网络分支的深度卷积层的卷积核尺寸为第四尺寸, 所述第一尺 寸、 所述第二尺寸、 所述第三尺寸以及所述第四尺寸的大小不同; 基于所述第 一目标初始网络模块和所述第 二目标初始网络模块, 生成所述初始识别模 型。 4.根据权利要求3所述的方法, 其特征在于, 对所述训练后的识别模型的目标层网络结 构进行融合处 理, 得到所述目标识别模型, 包括: 对所述第一网络模块中的所述批量归一化层进行转换处理, 得到第一深度卷积层, 其 中, 所述第一深度卷积层的卷积核尺寸 为所述第一尺寸; 对所述卷积核尺寸为第二尺寸的深度卷积层进行转换处理, 得到第二深度卷积层, 其 中, 所述第二深度卷积层的卷积核尺寸 为所述第一尺寸; 将所述第二网络模块中的所述批量归一化层与 所述第二深度卷积层进行融合处理, 得 到第三深度卷积层, 其中, 所述第三深度卷积层的卷积核尺寸 为所述第一尺寸; 将所述第一深度 卷积层、 所述第 三深度卷积层以及所述残差结构的深度 卷积层进行融 合处理, 得到所述目标识别模型。 5.根据权利要求2所述的方法, 其特征在于, 在获取目标样本数据集之前, 所述方法还 包括:权 利 要 求 书 1/2 页 2 CN 115471779 A 2获取样本数据集; 对所述样本数据集进行图像增强处理, 得到所述目标样本数据集, 其中, 所述图像增强 处理至少包括随机混淆增强处 理、 背景替换增强处 理。 6.根据权利要求2所述的方法, 其特征在于, 在对所述训练后的识别模型的目标层网络 结构进行融合处 理, 得到所述目标识别模型之后, 所述方法还 包括: 将所述目标识别模型转换为目标文件, 并将所述目标文件集成至目标平台, 其中, 所述 目标文件的格式为所述目标平台能够识别的文件格式。 7.根据权利要求1所述的方法, 其特征在于, 在确定所述待识别图像为目标图像之后, 所述方法还 包括: 响应页面跳转指令, 并显示预设页面, 其中, 所述预设页面用于引导目标对象参与所述 预设页面上的活动。 8.一种图像识别装置, 其特 征在于, 包括: 获取模块, 用于获取至少一个视频帧, 其中, 所述视频帧中至少包括待识别图像; 处理模块, 用于将所述待识别图像输入目标识别模型中, 输出多个识别结果, 其中, 所 述目标识别模型是通过向第一识别模型中添加目标网络模块得到的, 所述目标网络模块用 于对所述第一识别模型的网络 分支进行扩展, 所述识别结果表征所述待识别图像属于该识 别结果所对应 类别的概 率; 确定模块, 用于根据多个所述识别结果确定所述待识别图像所属的目标类别, 并在所 述目标类别满足预设条件的情况下, 确定所述待识别图像为目标图像, 其中, 所述目标图像 至少包括目标图形徽标。 9.一种计算机可读存储介质, 其特征在于, 所述计算机可读存储介质中存储有计算机 程序, 其中, 所述计算机程序被设置为运行时执行所述权利要求1至7任一项中所述的图像 识别方法。 10.一种电子设备, 其特征在于, 所述电子设备包括一个或多个处理器; 存储器, 用于存 储一个或多个程序, 当所述一个或多个程序被所述一个或多个处理器执行时, 使得所述一 个或多个处理器实现用于运行程序, 其中, 所述程序被设置为运行时执行所述权利要求 1至 7任一项中所述的图像识别方法。权 利 要 求 书 2/2 页 3 CN 115471779 A 3

PDF文档 专利 图像识别方法、装置、计算机可读存储介质及电子设备

文档预览
中文文档 17 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 图像识别方法、装置、计算机可读存储介质及电子设备 第 1 页 专利 图像识别方法、装置、计算机可读存储介质及电子设备 第 2 页 专利 图像识别方法、装置、计算机可读存储介质及电子设备 第 3 页
下载文档到电脑,方便使用
本文档由 SC 于 2024-02-18 22:24:32上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。