(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111669895.4
(22)申请日 2021.12.3 0
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 杨馥魁
(74)专利代理 机构 北京博浩百 睿知识产权代理
有限责任公司 1 1134
代理人 丰佩印
(51)Int.Cl.
G06K 9/62(2022.01)
G06V 10/764(2022.01)
G06N 20/00(2019.01)
(54)发明名称
模型处理方法、 装置、 图像识别方法及装置
(57)摘要
本公开提供了一种模 型处理方法及装置, 图
像识别方法及装置, 涉及人工智 能技术领域, 具
体为计算机视觉和深度学习技术领域, 可应用于
图像处理和图像识别等场景下。 具体实现方案
为: 获取多组样本图像, 其中, 多组样本图像分别
包括: 第一 分辨率图像和第二分辨率图像, 其中,
第一分辨率图像对应于低于预定分辨率的第一
分辨率, 第二分辨率图像对应于高于预定分辨率
的第二分辨率; 采用多组样本图像, 对第一模型
进行训练, 得到目标第一模型。
权利要求书3页 说明书10页 附图3页
CN 114330576 A
2022.04.12
CN 114330576 A
1.一种模型处 理方法, 包括:
获取多组样本图像, 其中, 所述多组样本图像分别包括: 第 一分辨率图像和第 二分辨率
图像, 其中, 所述第一分辨率图像对应于低于预定 分辨率的第一分辨率, 所述第二分辨率图
像对应于高于所述预定分辨 率的第二分辨 率;
采用所述多组样本图像, 对第一模型进行训练, 得到目标第一模型。
2.根据权利要求1所述的方法, 其中, 所述采用所述多组样本 图像, 对第一模型进行训
练, 得到目标第一模型, 包括:
将所述多组样本图像中的第 一分辨率图像和第 二分辨率图像分别输入所述第 一模型,
得到对应的第一预测结果和第二预测结果, 以及将所述多组样本图像中的第一分辨率图像
和第二分辨 率图像分别输入第二模型, 得到对应的第三预测结果和第四预测结果;
基于所述第 一预测结果, 所述第 二预测结果, 所述第 三预测结果和所述第四预测结果,
构造损失函数;
基于所述损失函数, 对所述第一模型进行训练, 得到所述目标第一模型。
3.根据权利要求2所述的方法, 其中, 所述基于所述第 一预测结果, 所述第 二预测结果,
所述第三预测结果和所述第四预测结果, 构造损失函数包括:
通过多项求和的方式, 构造所述损失函数, 其中, 所述多项包括以下至少两项: 第一预
测结果与第三预测结果构造的第一项, 第一预测结果与第四预测结果构造的第二项, 第二
预测结果与第三预测结果构造的第三项, 第二预测结果与第四预测结果构造的第四项。
4.根据权利要求2所述的方法, 其中, 所述基于所述损 失函数, 对所述第一模型进行训
练, 得到所述目标第一模型, 包括:
对所述第一模型的模型参数采用梯度 下降更新, 以及对所述第 二模型的模型参数采用
与所述第一模型的模型参数对应动量更新, 分别得到针对所述第一分辨率图像和所述第二
分辨率图像对应的损失函数 的损失值, 在得到的所述损失函数的损失值达到预定阈值时,
确定模型参数对应的第一模型为所述目标第一模型。
5.根据权利要求4所述的方法, 其中, 所述对所述第 二模型的模型参数采用与 所述第一
模型的模型参数对应动量更新包括:
获取所述第一模型采用梯度下降更新后的模型参数以及预定的动量更新 值;
基于所述第 一模型采用梯度 下降更新后的模型参数以及所述预定的动量更新值, 对所
述第二模型的模型参数进行 更新, 得到所述第二模型 更新后的模型参数。
6.根据权利要求2所述的方法, 其中, 所述将所述多组样本图像中的第 一分辨率图像和
第二分辨 率图像分别输入第二模型, 得到对应的第三预测结果和第四预测结果, 包括:
将所述第一分辨率图像和所述第 二分辨率图像分别输入所述第 二模型进行特征提取,
得到第三分辨 率特征和第四分辨 率特征;
确定所述第 三分辨率特征对应的所述第 三预测结果, 以及所述第四分辨率特征对应的
第四预测结果。
7.根据权利要求6所述的方法, 其中, 所述确定所述第 三分辨率特征对应的第 三预测结
果以及所述第四分辨 率特征对应的第四预测结果包括:
获取所述第 三分辨率特征对应的第 一中心特征, 以及所述第四分辨率特征对应的第 二
中心特征;权 利 要 求 书 1/3 页
2
CN 114330576 A
2基于所述第 三分辨率特征和所述第 一中心特征确定所述第 三预测结果, 以及基于所述
第四分辨 率特征和所述第二中心特 征确定所述第四预测结果。
8.根据权利要求1至7中任一项所述的方法, 其中, 所述获取所述多组样本 图像中的第
一分辨率图像和第二分辨 率图像包括:
对预定内容的图像进行数据增强处理, 得到所述第 一分辨率图像和所述第 二分辨率图
像。
9.一种图像识别方法, 包括:
获取待识别图像;
对所述待识别图像进行特征提取, 得到第一分辨率特征和第 二分辨率特征, 其中, 所述
第一分辨率特征对应于低于预定分辨率的第一分辨率, 所述第二分辨率特征对应于高于所
述预定分辨 率的第二分辨 率;
基于所述第一分辨率特征和所述第二分辨率特征, 对所述待识别图像进行识别, 得到
图像识别结果。
10.一种模型处 理装置, 包括:
第一获取模块, 用于获取多组样本图像, 其中, 所述多组样本图像分别包括: 第一分辨
率图像和第二分辨率图像, 其中, 所述第一分辨率图像对应于低于预定分辨率的第一分辨
率, 所述第二分辨 率图像对应于高于所述预定分辨 率的第二分辨 率;
训练模块, 用于采用所述多组样本图像, 对第一模型进行训练, 得到目标第一模型。
11.根据权利要求10所述的装置, 其中, 所述训练模块包括:
处理单元, 用于将所述多组样本图像中的第 一分辨率图像和第 二分辨率图像分别输入
所述第一模型, 得到对应的第一预测结果和第二预测结果, 以及将所述多组样本图像中的
第一分辨率图像和 第二分辨率图像分别输入第二模型, 得到对应的第三预测结果和第四预
测结果;
构造单元, 用于基于所述第 一预测结果, 所述第 二预测结果, 所述第 三预测结果和所述
第四预测结果, 构造损失函数;
训练单元, 用于基于所述损失函数, 对所述第一模型进行训练, 得到所述目标第一模
型。
12.根据权利要求1 1所述的装置, 其中, 所述构造单 元包括:
构造子单元, 用于通过多项求和的方式, 构造所述损失函数, 其中, 所述多项包括以下
至少两项: 第一预测结果与第三预测结果构造的第一项, 第一预测结果与第四预测结果构
造的第二项, 第二预测结果与第三预测结果构造的第三项, 第二预测结果与第四预测结果
构造的第四项。
13.根据权利要求1 1所述的装置, 其中, 所述训练单 元包括:
处理子单元, 用于对所述第一模型的模型参数采用 梯度下降更新, 以及对所述第二模
型的模型参数采用与所述第一模型的模型参数对应动量更新, 分别得到针对所述第一分辨
率图像和所述第二分辨率图像对应的损失函数的损失值, 在得到的所述损失函数的损失值
达到预定阈值时, 确定模型参数对应的第一模型为所述目标第一模型。
14.根据权利要求13所述的装置, 其中, 所述处 理子单元包括:
第一获取次子单元, 用于获取所述第 一模型采用梯度下降更新后的模型参数以及预定权 利 要 求 书 2/3 页
3
CN 114330576 A
3
专利 模型处理方法、装置、图像识别方法及装置
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 19:31:48上传分享