专利 模型处理方法、装置、图像识别方法及装置

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111669895.4 (22)申请日 2021.12.3 0 (71)申请人北京百度网讯科技有限公司地址 100085 北京市海淀区上地十街10号百度大厦2层 (72)发明人杨馥魁　 (74)专利代理机构北京博浩百睿知识产权代理有限责任公司 1 1134 代理人丰佩印 (51)Int.Cl. G06K 9/62(2022.01) G06V 10/764(2022.01) G06N 20/00(2019.01) (54)发明名称模型处理方法、装置、图像识别方法及装置 (57)摘要本公开提供了一种模型处理方法及装置，图像识别方法及装置，涉及人工智能技术领域，具体为计算机视觉和深度学习技术领域，可应用于图像处理和图像识别等场景下。具体实现方案为：获取多组样本图像，其中，多组样本图像分别包括：第一分辨率图像和第二分辨率图像，其中，第一分辨率图像对应于低于预定分辨率的第一分辨率，第二分辨率图像对应于高于预定分辨率的第二分辨率；采用多组样本图像，对第一模型进行训练，得到目标第一模型。权利要求书3页说明书10页附图3页 CN 114330576 A 2022.04.12 CN 114330576 A 1.一种模型处理方法，包括：获取多组样本图像，其中，所述多组样本图像分别包括：第一分辨率图像和第二分辨率图像，其中，所述第一分辨率图像对应于低于预定分辨率的第一分辨率，所述第二分辨率图像对应于高于所述预定分辨率的第二分辨率；采用所述多组样本图像，对第一模型进行训练，得到目标第一模型。 2.根据权利要求1所述的方法，其中，所述采用所述多组样本图像，对第一模型进行训练，得到目标第一模型，包括：将所述多组样本图像中的第一分辨率图像和第二分辨率图像分别输入所述第一模型，得到对应的第一预测结果和第二预测结果，以及将所述多组样本图像中的第一分辨率图像和第二分辨率图像分别输入第二模型，得到对应的第三预测结果和第四预测结果；基于所述第一预测结果，所述第二预测结果，所述第三预测结果和所述第四预测结果，构造损失函数；基于所述损失函数，对所述第一模型进行训练，得到所述目标第一模型。 3.根据权利要求2所述的方法，其中，所述基于所述第一预测结果，所述第二预测结果，所述第三预测结果和所述第四预测结果，构造损失函数包括：通过多项求和的方式，构造所述损失函数，其中，所述多项包括以下至少两项：第一预测结果与第三预测结果构造的第一项，第一预测结果与第四预测结果构造的第二项，第二预测结果与第三预测结果构造的第三项，第二预测结果与第四预测结果构造的第四项。 4.根据权利要求2所述的方法，其中，所述基于所述损失函数，对所述第一模型进行训练，得到所述目标第一模型，包括：对所述第一模型的模型参数采用梯度下降更新，以及对所述第二模型的模型参数采用与所述第一模型的模型参数对应动量更新，分别得到针对所述第一分辨率图像和所述第二分辨率图像对应的损失函数的损失值，在得到的所述损失函数的损失值达到预定阈值时，确定模型参数对应的第一模型为所述目标第一模型。 5.根据权利要求4所述的方法，其中，所述对所述第二模型的模型参数采用与所述第一模型的模型参数对应动量更新包括：获取所述第一模型采用梯度下降更新后的模型参数以及预定的动量更新值；基于所述第一模型采用梯度下降更新后的模型参数以及所述预定的动量更新值，对所述第二模型的模型参数进行更新，得到所述第二模型更新后的模型参数。 6.根据权利要求2所述的方法，其中，所述将所述多组样本图像中的第一分辨率图像和第二分辨率图像分别输入第二模型，得到对应的第三预测结果和第四预测结果，包括：将所述第一分辨率图像和所述第二分辨率图像分别输入所述第二模型进行特征提取，得到第三分辨率特征和第四分辨率特征；确定所述第三分辨率特征对应的所述第三预测结果，以及所述第四分辨率特征对应的第四预测结果。 7.根据权利要求6所述的方法，其中，所述确定所述第三分辨率特征对应的第三预测结果以及所述第四分辨率特征对应的第四预测结果包括：获取所述第三分辨率特征对应的第一中心特征，以及所述第四分辨率特征对应的第二中心特征；权　利　要　求　书 1/3 页 2 CN 114330576 A 2基于所述第三分辨率特征和所述第一中心特征确定所述第三预测结果，以及基于所述第四分辨率特征和所述第二中心特征确定所述第四预测结果。 8.根据权利要求1至7中任一项所述的方法，其中，所述获取所述多组样本图像中的第一分辨率图像和第二分辨率图像包括：对预定内容的图像进行数据增强处理，得到所述第一分辨率图像和所述第二分辨率图像。 9.一种图像识别方法，包括：获取待识别图像；对所述待识别图像进行特征提取，得到第一分辨率特征和第二分辨率特征，其中，所述第一分辨率特征对应于低于预定分辨率的第一分辨率，所述第二分辨率特征对应于高于所述预定分辨率的第二分辨率；基于所述第一分辨率特征和所述第二分辨率特征，对所述待识别图像进行识别，得到图像识别结果。 10.一种模型处理装置，包括：第一获取模块，用于获取多组样本图像，其中，所述多组样本图像分别包括：第一分辨率图像和第二分辨率图像，其中，所述第一分辨率图像对应于低于预定分辨率的第一分辨率，所述第二分辨率图像对应于高于所述预定分辨率的第二分辨率；训练模块，用于采用所述多组样本图像，对第一模型进行训练，得到目标第一模型。 11.根据权利要求10所述的装置，其中，所述训练模块包括：处理单元，用于将所述多组样本图像中的第一分辨率图像和第二分辨率图像分别输入所述第一模型，得到对应的第一预测结果和第二预测结果，以及将所述多组样本图像中的第一分辨率图像和第二分辨率图像分别输入第二模型，得到对应的第三预测结果和第四预测结果；构造单元，用于基于所述第一预测结果，所述第二预测结果，所述第三预测结果和所述第四预测结果，构造损失函数；训练单元，用于基于所述损失函数，对所述第一模型进行训练，得到所述目标第一模型。 12.根据权利要求1 1所述的装置，其中，所述构造单元包括：构造子单元，用于通过多项求和的方式，构造所述损失函数，其中，所述多项包括以下至少两项：第一预测结果与第三预测结果构造的第一项，第一预测结果与第四预测结果构造的第二项，第二预测结果与第三预测结果构造的第三项，第二预测结果与第四预测结果构造的第四项。 13.根据权利要求1 1所述的装置，其中，所述训练单元包括：处理子单元，用于对所述第一模型的模型参数采用梯度下降更新，以及对所述第二模型的模型参数采用与所述第一模型的模型参数对应动量更新，分别得到针对所述第一分辨率图像和所述第二分辨率图像对应的损失函数的损失值，在得到的所述损失函数的损失值达到预定阈值时，确定模型参数对应的第一模型为所述目标第一模型。 14.根据权利要求13所述的装置，其中，所述处理子单元包括：第一获取次子单元，用于获取所述第一模型采用梯度下降更新后的模型参数以及预定权　利　要　求　书 2/3 页 3 CN 114330576 A 3

专利 模型处理方法、装置、图像识别方法及装置

专利模型处理方法、装置、图像识别方法及装置