专利 获取跨域学习模型的方法及装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210581106.X (22)申请日 2022.05.26 (71)申请人阿里巴巴（中国）有限公司地址 311121 浙江省杭州市余杭区五常街道文一西路969号3幢5层5 54室 (72)发明人吕芳蕊　梁健　刘迪　 (74)专利代理机构北京众达德权知识产权代理有限公司 1 1570 专利代理师袁媛 (51)Int.Cl. G06V 10/774(2022.01) G06V 10/764(2022.01) G06V 10/80(2022.01) G06V 10/42(2022.01) (54)发明名称获取跨域学习模型的方法及装置 (57)摘要本申请实施例公开了一种获取跨域学习模型的方法及装置。其中方法包括：获取来源于多个源域的训练数据；将来源于其中一部分源域的训练数据作为元训练数据，将来源于另一部分源域的训练数据作为元测试数据；利用元训练数据和元测试数据训练跨域学习模型，训练目标包括：利用元训练数据训练得到的跨域学习模型在元测试数据上的收益符合凸博弈的超模性；以及，跨域学习模型针对元训练数据和元测试数据的输出结果符合预期；训练得到的跨域学习模型用以对来源于目标域的输入数据进行分析和预测，输出预测结果，目标域为多个源域中的一个或者为除了多个源域之外的其他领域。通过本申请能够提高模型的跨域泛化性能。权利要求书2页说明书11页附图4页 CN 115115901 A 2022.09.27 CN 115115901 A 1.一种获取跨域学习模型的方法，其特征在于，该方法包括：获取来源于多个源域的训练数据；将来源于其中一部分源域的训练数据作为元训练数据，将来源于另一部分源域的训练数据作为元测试数据；利用所述元训练数据和所述元测试数据训练所述跨域学习模型，训练目标包括第一训练目标和第二训练目标；所述第一训练目标为：利用所述元训练数据训练得到的跨域学习模型在所述元测试数据上的收益符合凸博弈的超模性；所述第二训练目标为：所述跨域学习模型针对所述元训练数据和元测试数据的输出结果符合预期；训练得到的跨域学习模型用以对来源于目标域的输入数据进行分析和预测，输出预测结果，所述目标域为所述多个源域中的一个或者为除了所述多个源域之外的其他领域。 2.根据权利要求1所述的方法，其特征在于，在所述将来源于其中一部分源域的训练数据作为元训练数据，将来源于另一部分源域的训练数据作为元测试数据之前，还包括：对所述来源于多个源域的训练数据分别进行傅立叶增广，得到增广后各源域的训练数据。 3.根据权利要求1所述的方法，其特征在于，该方法还包括：利用所述元训练数据构造第一数据集合和第二数据集合，并获取所述第一数据集合和所述第二数据集合的交集作为第三数据集合，获取所述第一数据集合和所述第二数据集合的并集作为第四数据集合；利用所述元训练数据和所述元测试数据训练所述跨域学习模型包括：分别利用所述第一数据集合、第二数据集合、第三数据集合和第四数据集合对所述跨域学习模型进行元训练，得到第一模型参数、第二模型参数、第三模型参数和第四模型参数；分别获取所述元测试数据在所述第一模型参数、第二模型参数、第三模型参数和第四模型参数上对应的第一损失函数值、第二损失函数值、第三损失函数值和第四损失函数值；所述第一训练目标包括：最小化所述第三损失函数值与第四损失函数值之和减去所述第一损失函数与第二损失函数值之和所得到的差值。 4.根据权利要求1、 2或3所述的方法，其特征在于，所述训练包括：在每一轮迭代中确定总损失函数的取值，利用总损失函数的取值更新模型参数，直至满足预设的训练结束条件；其中所述总损失函数是对第五损失函数和第六损失函数进行加权求和后得到的，所述第五损失函数是依据所述第一训练目标预先构建的，所述第六损失函数是依据所述第二训练目标预先构建的。 5.根据权利要求1所述的方法，其特征在于，该方法还包括：确定所述训练数据对所述第一训练目标的贡献度评分；从所述训练数据中删除贡献度评分满足预设低质量评分标准的训练数据；利用所述删除的处理之后得到的训练数据更新模型参数用以实现所述第二训练目标。 6.根据权利要求5所述的方法，其特征在于，确定所述训练样本对所述第一训练目标的贡献度评分包括：利用第五损失函数对训练样本的梯度与该训练样本的特征表示的乘积，确定该训练样本对所述第一训练目标的贡献度评分；其中，所述第五损失函数是依据所述第一训练目标预先构建的。权　利　要　求　书 1/2 页 2 CN 115115901 A 27.根据权利要求1至6中任一项所述的方法，其特征在于，所述多个源域的训练数据包括：多个领域的图像及其分类标签，所述跨域学习模型为图像识别模型；或者，所述多个源域的训练数据包括：多个国家的用户以及用户关注的推广数据，所述跨域学习模型为信息推荐模型。 8.一种获取跨域学习模型的装置，其特征在于，该装置包括：样本获取单元，被配置为获取来源于多个源域的训练数据；样本划分单元，被配置为将来源于其中一部分源域的训练数据作为元训练数据，将来源于另一部分源域的训练数据作为元测试数据；模型训练单元，被配置为利用所述元训练数据和所述元测试数据训练所述跨域学习模型，训练目标包括第一训练目标和第二训练目标；所述第一训练目标为：利用所述元训练数据训练得到的跨域学习模型在所述元测试数据上的收益符合凸博弈的超模性；所述第二训练目标为：所述跨域学习模型针对所述元训练数据和元测试数据的输出结果符合预期；所述训练得到的跨域学习模型用以对来源于目标域的输入数据进行分析和预测，输出预测结果，所述目标域为所述多个源域中的一个或者为除了所述多个源域之外的其他领域。 9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1至7任一项所述的方法的步骤。 10.一种电子设备，其特征在于，包括：一个或多个处理器；以及与所述一个或多个处理器关联的存储器，所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时，执行权利要求1至7任一项所述的方法的步骤。权　利　要　求　书 2/2 页 3 CN 115115901 A 3

专利 获取跨域学习模型的方法及装置

专利获取跨域学习模型的方法及装置