(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210581106.X
(22)申请日 2022.05.26
(71)申请人 阿里巴巴 (中国) 有限公司
地址 311121 浙江省杭州市余杭区五常街
道文一西路969号3幢5层5 54室
(72)发明人 吕芳蕊 梁健 刘迪
(74)专利代理 机构 北京众达德权知识产权代理
有限公司 1 1570
专利代理师 袁媛
(51)Int.Cl.
G06V 10/774(2022.01)
G06V 10/764(2022.01)
G06V 10/80(2022.01)
G06V 10/42(2022.01)
(54)发明名称
获取跨域学习模型的方法及装置
(57)摘要
本申请实施例公开了一种获取跨域学习模
型的方法及装置。 其中方法包括: 获取来源于多
个源域的训练数据; 将来源于其中一部分源域的
训练数据作为元训练数据, 将来源于另一部分源
域的训练数据作为元测试数据; 利用元训练数据
和元测试数据训练跨域学习模型, 训练目标包
括: 利用元训练数据训练得到的跨域学习模型在
元测试数据上的收益符合凸博弈的超模性; 以
及, 跨域学习模 型针对元训练数据和元测试数据
的输出结果符合预期; 训练得到的跨域学习模型
用以对来源于目标域的输入数据进行分析和预
测, 输出预测结果, 目标域为多个源域中的一个
或者为除了多个源域之外的其他领域。 通过本申
请能够提高模型的跨 域泛化性能。
权利要求书2页 说明书11页 附图4页
CN 115115901 A
2022.09.27
CN 115115901 A
1.一种获取跨 域学习模型的方法, 其特 征在于, 该 方法包括:
获取来源于多个源域的训练数据;
将来源于其中一部分源域的训练数据作为元训练数据, 将来源于另一部分源域的训练
数据作为元测试 数据;
利用所述元训练数据和所述元测试数据训练所述跨域学习 模型, 训练目标包括第 一训
练目标和第二训练目标; 所述第一训练目标为: 利用所述元训练数据训练得到的跨域学习
模型在所述元测试数据上 的收益符合凸博弈 的超模性; 所述第二训练目标为: 所述跨域学
习模型针对所述元训练数据和元测试 数据的输出 结果符合预期;
训练得到的跨域学习 模型用以对来源于目标域的输入数据进行分析和预测, 输出预测
结果, 所述目标域 为所述多个源域中的一个或者 为除了所述多个源域之外的其 他领域。
2.根据权利要求1所述的方法, 其特征在于, 在所述将来源于其中一部分源域的训练数
据作为元训练数据, 将来源于另一部分源域的训练数据作为元测试 数据之前, 还 包括:
对所述来源于多个源域的训练数据分别进行傅立叶增广, 得到增广后各源域的训练数
据。
3.根据权利要求1所述的方法, 其特征在于, 该方法还包括: 利用所述元训练数据构造
第一数据集合和 第二数据集合, 并获取所述第一数据集合和所述第二数据集合的交集作为
第三数据集 合, 获取所述第一数据集 合和所述第二数据集 合的并集作为第四数据集 合;
利用所述元训练数据和所述元测试数据训练所述跨域学习 模型包括: 分别利用所述第
一数据集合、 第二数据集合、 第三数据集合和第四数据集合对所述跨域学习模型进行元训
练, 得到第一模型参数、 第二模型参数、 第三模型参数和第四模型参数; 分别获取所述元测
试数据在所述第一模型参数、 第二模型参数、 第三模型参数和第四模型参数上对应的第一
损失函数值、 第二损失函数值、 第三损失函数值和第四损失函数值;
所述第一训练目标包括: 最小化所述第 三损失函数值与第四损失函数值之和减去所述
第一损失函数与第二损失函数值之和所 得到的差值。
4.根据权利要求1、 2或3所述的方法, 其特 征在于, 所述训练包括:
在每一轮迭代中确定总损 失函数的取值, 利用总损 失函数的取值更新模型参数, 直至
满足预设的训练结束条件;
其中所述总损失函数是对第五损失函数和第六损失函数进行加权求和后得到的, 所述
第五损失函数是依据所述第一训练目标预先构建的, 所述第六损失函数是依据所述第二训
练目标预先构建的。
5.根据权利要求1所述的方法, 其特 征在于, 该 方法还包括:
确定所述训练数据对所述第一训练目标的贡献度评分;
从所述训练数据中删除贡献度评分满足预设低质量评分标准的训练数据;
利用所述删除的处 理之后得到的训练数据更新模型参数用以实现所述第二训练目标。
6.根据权利要求5所述的方法, 其特征在于, 确定所述训练样本对所述第 一训练目标的
贡献度评分包括:
利用第五损失函数对训练样本的梯度与 该训练样本的特征表示的乘积, 确定该训练样
本对所述第一训练目标的贡献度评分; 其中, 所述第 五损失函数是依据所述第一训练目标
预先构建的。权 利 要 求 书 1/2 页
2
CN 115115901 A
27.根据权利要求1至6中任一项所述的方法, 其特征在于, 所述多个源域的训练数据包
括: 多个领域的图像及其分类标签, 所述 跨域学习模型为图像识别模型; 或者,
所述多个源域的训练数据包括: 多个国家 的用户以及用户关注的推广数据, 所述跨域
学习模型为信息推荐模型。
8.一种获取跨 域学习模型的装置, 其特 征在于, 该装置包括:
样本获取 单元, 被配置为获取来源于多个源域的训练数据;
样本划分单元, 被配置为将来源于其中一部分源域的训练数据作为元训练数据, 将来
源于另一部分源域的训练数据作为元测试 数据;
模型训练单元, 被配置为利用所述元训练数据和所述元测试数据训练所述跨域学习 模
型, 训练目标包括第一训练目标和第二训练目标; 所述第一训练目标为: 利用所述元训练数
据训练得到的跨域学习模型在所述元测试数据上的收益符合凸博弈的超模性; 所述第二训
练目标为: 所述 跨域学习模型针对所述元训练数据和元测试 数据的输出 结果符合预期;
所述训练得到的跨域学习模型用以对来源于目标域的输入数据进行分析和预测, 输出
预测结果, 所述目标域为所述多个源域中的一个或者为除了所述多个源域之外的其他领
域。
9.一种计算机可读存储介质, 其上存储有计算机程序, 其特征在于, 该程序被处理器执
行时实现权利要求1至7任一项所述的方法的步骤。
10.一种电子设备, 其特 征在于, 包括:
一个或多个处 理器; 以及
与所述一个或多个处理器关联的存储器, 所述存储器用于存储程序指令,所述程序指
令在被所述 一个或多个处 理器读取 执行时, 执行权利要求1至7任一项所述的方法的步骤。权 利 要 求 书 2/2 页
3
CN 115115901 A
3
专利 获取跨域学习模型的方法及装置
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 12:50:44上传分享