(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111649140.8
(22)申请日 2021.12.3 0
(71)申请人 腾讯音乐娱乐科技 (深圳) 有限公司
地址 518000 广东省深圳市前海深港合作
区前湾一路1号A栋201室
(72)发明人 萧永乐
(74)专利代理 机构 北京金知睿知识产权代理事
务所(普通 合伙) 11379
代理人 谭彦闻
(51)Int.Cl.
G06F 16/9535(2019.01)
G06N 20/00(2019.01)
(54)发明名称
推荐系统训练方法、 推荐系统、 电子设备及
存储介质
(57)摘要
本申请公开一种推荐系统训练方法, 其包
括: 在给定的用户物品评分数据中针对每个用户
随机选取第一评分数据和第二评分数据; 由所述
第一评分数据训练得到推荐系统; 以预定的迭代
条件迭代执行下述步骤: 对于每个用户, 利用所
述推荐系统分别预测至少一个推荐物品; 在所述
第二评分数据中获取所述每个用户对所述推荐
物品的评分, 将所述评分加入到所述第一评分数
据中, 以得到新的第一评分数据; 确定用户对所
述新的第一评分数据中的每个物品的倾向性偏
差, 作为反倾向性系数; 基于含有反倾向性系数
的目标函数, 利用所述新的第一评分数据更新所
述推荐系统。 本申请还公开一种推荐系统、 电子
设备和存 储介质。
权利要求书3页 说明书16页 附图8页
CN 114297500 A
2022.04.08
CN 114297500 A
1.一种推荐系统训练方法, 其特 征在于, 包括:
在给定的用户物品评分数据中针对每个用户选取第一评分数据和第二评分数据, 其
中, 所述给定的用户物品评分数据具有用户对物品的评分, 所述第一评分数据与所述第二
评分数据不重 叠;
由所述第一评分数据训练得到推荐系统;
以预定的第一迭代条件 迭代执行下述更新所述推荐系统的步骤:
对于每个用户, 利用所述推荐系统分别预测至少一个 推荐物品;
在所述第二评分数据中获取所述每个用户对所述推荐物品的评分, 将所述评分加入到
所述第一评分数据中, 以得到新的第一评分数据;
确定用户对所述 新的第一评分数据中的每 个物品的倾向性偏差, 作为反倾向性系数;
基于含有反倾向性系数的目标函数, 利用所述 新的第一评分数据更新所述推荐系统。
2.根据权利要求1所述的推荐系统训练方法, 其特征在于, 更新所述推荐系统的步骤,
还包括:
获得每个用户的评分偏差, 由所述评分偏差确定用户感知系数;
其中, 所述基于含有反倾向性系数的目标函数, 利用所述新的第一评分数据更新所述
推荐模型, 包括:
基于含有反倾向性系数和用户感知系数的目标函数, 利用所述新的第 一评分数据 更新
所述推荐模型。
3.根据权利要求2所述的推荐系统训练方法, 其特征在于, 所述获得每个用户的评分偏
差, 由所述评分偏差确定用户感知系数, 包括:
确定所述每 个用户的评分范围;
由所述评分范围确定 评分均值;
基于每个用户的评分范围与所述评分均值的差异确定每 个用户的评分偏差;
由所述每 个用户的评分偏差确定每 个用户的所述用户感知系数。
4.根据权利要求1至3中任一项所述的推荐系统训练方法, 其特征在于, 所述确定用户
对所述新的第一评分数据中的每 个物品的倾向性偏差, 作为反倾向性系数, 包括:
确定所述 新的第一评分数据中的每 个物品的热门度参数, 作为所述反倾向性系数。
5.根据权利要求4所述的推荐系统训练方法, 其特征在于, 所述确定所述新的第 一评分
数据中的每 个物品的热门度参数, 包括:
获取原始用户物品评分数据, 其中所述原始用户物品评分数据覆盖的用户和物品大于
所述给定的用户物品评 分数据, 且所述给定的用户物品评 分数据提取自所述原始用户物品
评分数据;
在所述始用户物品评分数据中, 统计总用户数以及对所述新的第 一评分数据中的每个
物品进行了 评分的评分用户数;
由所述评分用户数以及所述总用户数, 确定所述热门度参数。
6.根据权利要求1至3中任一项所述的推荐系统训练方法, 其特征在于, 所述确定用户
对所述新的第一评分数据中的每 个物品的倾向性偏差, 包括:
确定所述新的第 一评分数据中的每个物品的推荐位展示历史参数, 作为所述反倾向性
系数。权 利 要 求 书 1/3 页
2
CN 114297500 A
27.根据权利要求6所述的推荐系统训练方法, 其特征在于, 确定所述新的第 一评分数据
中的每个物品的推荐位展示历史参数, 包括:
获取推荐位展示历史数据;
在所述推荐位展示历史数据中, 统计推荐位总数以及所述新的第 一评分数据中的每个
物品出现在推荐位的次数和/或排名;
由所述次数和/或排名以及所述推荐位总数, 确定所述推荐位展示历史参数。
8.根据权利要求1至3中任一项所述的推荐系统训练方法, 其特征在于, 以预定的第一
迭代条件执 行所述更新所述推荐系统的步骤时:
对于奇数迭代循环, 所述倾向性偏差为所述新的第 一评分数据中的每个物品的热门度
参数和推荐位展示历史参数中的一种;
对于偶数迭代循环, 所述倾向性偏差为所述新的第 一评分数据中的每个物品的热门度
参数和推荐位展示历史参数中的另一种。
9.根据权利要求1至3中任一项所述的推荐系统训练方法, 其特征在于, 所述倾向性偏
差为所述 新的第一评分数据中的每 个物品的热门度参数和推荐位展示历史参数中的一种;
在以预定的第 一迭代条件迭代执行更新所述推荐系统 的步骤之后, 所述方法还包括以
预定的第二迭代条件执 行下述更新所述推荐系统的步骤:
对于每个用户, 利用所述推荐系统分别预测至少一个 推荐物品;
在所述第二评分数据中获取所述每个用户对所述推荐物品的评分, 将所述评分加入到
所述第一评分数据中, 以得到新的第一评分数据;
确定用户对所述新的第 一评分数据中的每个物品的第 二倾向性偏差, 作为第 二反倾向
性系数, 其中所述第二倾向性偏差为所述新的第一评分数据中的每个物品的热门度参数和
推荐位展示历史参数中的另一种;
基于含有第 二反倾向性系数的目标函数, 利用所述新的第 一评分数据 更新所述推荐系
统。
10.根据权利要求1至3中任一项所述的推荐系统训练方法, 其特征在于, 所述由所述第
一评分数据训练得到推荐系统, 包括:
屏蔽所述给定的用户物品评分数据中非第 一评分数据的评分, 获得基于所述第 一评分
数据的初始 化评分数据, 其中所述初始 化评分数据为具有与所述给定的用户物品评 分数据
相同维度的稀疏矩阵;
将所述初始化评分数据分解为用户数据和物品数据, 利用所述用户数据和所述物品数
据训练得到所述推荐系统。
11.根据权利要求1至 3中任一项所述的推荐系统训练方法, 其特 征在于, 还 包括:
在所述给定的用户物品评分数据中针对每个用户选取第 三评分数据, 其中所述第 三评
分数据与所述第一评分数据不重 叠;
利用所述第三评分数据测试完成迭代的所述推荐系统。
12.一种推荐系统, 其特征在于, 所述推荐系统由根据权利要求1至11中任一项所述的
推荐系统训练方法训练得到 。
13.一种电子设备, 其特征在于, 包括: 处理器和存储有计算机程序的存储器, 所述处理
器被配置成运行 所述计算器程序时实现根据权利要求1至1 1中任一项所述的方法。权 利 要 求 书 2/3 页
3
CN 114297500 A
3
专利 推荐系统训练方法、推荐系统、电子设备及存储介质
文档预览
中文文档
28 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共28页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 19:31:40上传分享