专利 图像识别方法、装置、计算机可读存储介质及电子设备

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211274337.2 (22)申请日 2022.10.18 (71)申请人中国工商银行股份有限公司地址 100140 北京市西城区复兴门内大街 55号 (72)发明人刘乙赛　罗涛　施佳子　李艳宇　 (74)专利代理机构北京康信知识产权代理有限责任公司 1 1240 专利代理师黄海英 (51)Int.Cl. G06V 20/40(2022.01) G06V 10/77(2022.01) G06V 10/774(2022.01) G06V 10/80(2022.01) G06V 10/82(2022.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称图像识别方法、装置、计算机可读存储介质及电子设备 (57)摘要本发明公开了一种图像识别方法、装置、计算机可读存储介质及电子设备，涉及人工智能技术领域。其中，该方法包括：获取至少一个视频帧，其中，视频帧中至少包括待识别图像；将待识别图像输入目标识别模型中，输出多个识别结果，其中，目标识别模型是通过向第一识别模型中添加目标网络模块得到的，目标网络模块用于对第一识别模型的网络分支进行扩展，识别结果表征待识别图像属于该识别结果所对应类别的概率；根据多个识别结果确定待识别图像所属的目标类别，并在目标类别满足预设条件的情况下，确定待识别图像为目标图像，其中，目标图像至少包括目标图形徽标。本发明解决了现有技术中的图像识别模型对图形徽标的识别准确度低的技术问题。权利要求书2页说明书10页附图4页 CN 115471779 A 2022.12.13 CN 115471779 A 1.一种图像识别方法，其特征在于，包括：获取至少一个视频帧，其中，所述视频帧中至少包括待识别图像；将所述待识别图像输入目标识别模型中，输出多个识别结果，其中，所述目标识别模型是通过向第一识别模型中添加目标网络模块得到的，所述目标网络模块用于对所述第一识别模型的网络分支进行扩展，所述识别结果表征所述待识别图像属于该识别结果所对应类别的概率；根据多个所述识别结果确定所述待识别图像所属的目标类别，并在所述目标类别满足预设条件的情况下，确定所述待识别图像为目标图像，其中，所述目标图像至少包括目标图形徽标。 2.根据权利要求1所述的方法，其特征在于，通过以下方法生成所述目标识别模型：获取目标样本数据集；根据所述目标样本数据集对初始识别模型进行训练，得到训练后的识别模型；对所述训练后的识别模型的目标层网络结构进行融合处理，得到所述目标识别模型。 3.根据权利要求2所述的方法，其特征在于，在根据所述目标样本数据集对初始识别模型进行训练，得到训练后的识别模型之前，所述方法还包括：获取所述第一识别模型，其中，所述第一识别模型至少包括反向残差结构，所述反向残差结构至少包括残差结构和串联结构；在所述残差结构的逐点卷积层与所述残差结构的深度卷积层之间，添加第一网络模块和第二网络模块，得到第一目标初始网络模块，其中，所述残差结构的深度卷积层的卷积核尺寸为第一尺寸，所述第一网络模块由批量归一化层组成，所述第二网络模块由所述批量归一化层和卷积核尺寸为第二尺寸的深度卷积层组成；在所述串联结构中添加第三网络模块，得到第二目标初始网络模块，其中，所述第三网络模块至少包括第一网络分支和第二网络分支，所述第一网络分支的深度卷积层的卷积核尺寸为第三尺寸，所述第二网络分支的深度卷积层的卷积核尺寸为第四尺寸，所述第一尺寸、所述第二尺寸、所述第三尺寸以及所述第四尺寸的大小不同；基于所述第一目标初始网络模块和所述第二目标初始网络模块，生成所述初始识别模型。 4.根据权利要求3所述的方法，其特征在于，对所述训练后的识别模型的目标层网络结构进行融合处理，得到所述目标识别模型，包括：对所述第一网络模块中的所述批量归一化层进行转换处理，得到第一深度卷积层，其中，所述第一深度卷积层的卷积核尺寸为所述第一尺寸；对所述卷积核尺寸为第二尺寸的深度卷积层进行转换处理，得到第二深度卷积层，其中，所述第二深度卷积层的卷积核尺寸为所述第一尺寸；将所述第二网络模块中的所述批量归一化层与所述第二深度卷积层进行融合处理，得到第三深度卷积层，其中，所述第三深度卷积层的卷积核尺寸为所述第一尺寸；将所述第一深度卷积层、所述第三深度卷积层以及所述残差结构的深度卷积层进行融合处理，得到所述目标识别模型。 5.根据权利要求2所述的方法，其特征在于，在获取目标样本数据集之前，所述方法还包括：权　利　要　求　书 1/2 页 2 CN 115471779 A 2获取样本数据集；对所述样本数据集进行图像增强处理，得到所述目标样本数据集，其中，所述图像增强处理至少包括随机混淆增强处理、背景替换增强处理。 6.根据权利要求2所述的方法，其特征在于，在对所述训练后的识别模型的目标层网络结构进行融合处理，得到所述目标识别模型之后，所述方法还包括：将所述目标识别模型转换为目标文件，并将所述目标文件集成至目标平台，其中，所述目标文件的格式为所述目标平台能够识别的文件格式。 7.根据权利要求1所述的方法，其特征在于，在确定所述待识别图像为目标图像之后，所述方法还包括：响应页面跳转指令，并显示预设页面，其中，所述预设页面用于引导目标对象参与所述预设页面上的活动。 8.一种图像识别装置，其特征在于，包括：获取模块，用于获取至少一个视频帧，其中，所述视频帧中至少包括待识别图像；处理模块，用于将所述待识别图像输入目标识别模型中，输出多个识别结果，其中，所述目标识别模型是通过向第一识别模型中添加目标网络模块得到的，所述目标网络模块用于对所述第一识别模型的网络分支进行扩展，所述识别结果表征所述待识别图像属于该识别结果所对应类别的概率；确定模块，用于根据多个所述识别结果确定所述待识别图像所属的目标类别，并在所述目标类别满足预设条件的情况下，确定所述待识别图像为目标图像，其中，所述目标图像至少包括目标图形徽标。 9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行所述权利要求1至7任一项中所述的图像识别方法。 10.一种电子设备，其特征在于，所述电子设备包括一个或多个处理器；存储器，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现用于运行程序，其中，所述程序被设置为运行时执行所述权利要求 1至 7任一项中所述的图像识别方法。权　利　要　求　书 2/2 页 3 CN 115471779 A 3

专利 图像识别方法、装置、计算机可读存储介质及电子设备

专利图像识别方法、装置、计算机可读存储介质及电子设备