专利 推荐系统训练方法、推荐系统、电子设备及存储介质

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111649140.8 (22)申请日 2021.12.3 0 (71)申请人腾讯音乐娱乐科技（深圳）有限公司地址 518000 广东省深圳市前海深港合作区前湾一路1号A栋201室 (72)发明人萧永乐　 (74)专利代理机构北京金知睿知识产权代理事务所(普通合伙) 11379 代理人谭彦闻 (51)Int.Cl. G06F 16/9535(2019.01) G06N 20/00(2019.01) (54)发明名称推荐系统训练方法、推荐系统、电子设备及存储介质 (57)摘要本申请公开一种推荐系统训练方法，其包括：在给定的用户物品评分数据中针对每个用户随机选取第一评分数据和第二评分数据；由所述第一评分数据训练得到推荐系统；以预定的迭代条件迭代执行下述步骤：对于每个用户，利用所述推荐系统分别预测至少一个推荐物品；在所述第二评分数据中获取所述每个用户对所述推荐物品的评分，将所述评分加入到所述第一评分数据中，以得到新的第一评分数据；确定用户对所述新的第一评分数据中的每个物品的倾向性偏差，作为反倾向性系数；基于含有反倾向性系数的目标函数，利用所述新的第一评分数据更新所述推荐系统。本申请还公开一种推荐系统、电子设备和存储介质。权利要求书3页说明书16页附图8页 CN 114297500 A 2022.04.08 CN 114297500 A 1.一种推荐系统训练方法，其特征在于，包括：在给定的用户物品评分数据中针对每个用户选取第一评分数据和第二评分数据，其中，所述给定的用户物品评分数据具有用户对物品的评分，所述第一评分数据与所述第二评分数据不重叠；由所述第一评分数据训练得到推荐系统；以预定的第一迭代条件迭代执行下述更新所述推荐系统的步骤：对于每个用户，利用所述推荐系统分别预测至少一个推荐物品；在所述第二评分数据中获取所述每个用户对所述推荐物品的评分，将所述评分加入到所述第一评分数据中，以得到新的第一评分数据；确定用户对所述新的第一评分数据中的每个物品的倾向性偏差，作为反倾向性系数；基于含有反倾向性系数的目标函数，利用所述新的第一评分数据更新所述推荐系统。 2.根据权利要求1所述的推荐系统训练方法，其特征在于，更新所述推荐系统的步骤，还包括：获得每个用户的评分偏差，由所述评分偏差确定用户感知系数；其中，所述基于含有反倾向性系数的目标函数，利用所述新的第一评分数据更新所述推荐模型，包括：基于含有反倾向性系数和用户感知系数的目标函数，利用所述新的第一评分数据更新所述推荐模型。 3.根据权利要求2所述的推荐系统训练方法，其特征在于，所述获得每个用户的评分偏差，由所述评分偏差确定用户感知系数，包括：确定所述每个用户的评分范围；由所述评分范围确定评分均值；基于每个用户的评分范围与所述评分均值的差异确定每个用户的评分偏差；由所述每个用户的评分偏差确定每个用户的所述用户感知系数。 4.根据权利要求1至3中任一项所述的推荐系统训练方法，其特征在于，所述确定用户对所述新的第一评分数据中的每个物品的倾向性偏差，作为反倾向性系数，包括：确定所述新的第一评分数据中的每个物品的热门度参数，作为所述反倾向性系数。 5.根据权利要求4所述的推荐系统训练方法，其特征在于，所述确定所述新的第一评分数据中的每个物品的热门度参数，包括：获取原始用户物品评分数据，其中所述原始用户物品评分数据覆盖的用户和物品大于所述给定的用户物品评分数据，且所述给定的用户物品评分数据提取自所述原始用户物品评分数据；在所述始用户物品评分数据中，统计总用户数以及对所述新的第一评分数据中的每个物品进行了评分的评分用户数；由所述评分用户数以及所述总用户数，确定所述热门度参数。 6.根据权利要求1至3中任一项所述的推荐系统训练方法，其特征在于，所述确定用户对所述新的第一评分数据中的每个物品的倾向性偏差，包括：确定所述新的第一评分数据中的每个物品的推荐位展示历史参数，作为所述反倾向性系数。权　利　要　求　书 1/3 页 2 CN 114297500 A 27.根据权利要求6所述的推荐系统训练方法，其特征在于，确定所述新的第一评分数据中的每个物品的推荐位展示历史参数，包括：获取推荐位展示历史数据；在所述推荐位展示历史数据中，统计推荐位总数以及所述新的第一评分数据中的每个物品出现在推荐位的次数和/或排名；由所述次数和/或排名以及所述推荐位总数，确定所述推荐位展示历史参数。 8.根据权利要求1至3中任一项所述的推荐系统训练方法，其特征在于，以预定的第一迭代条件执行所述更新所述推荐系统的步骤时：对于奇数迭代循环，所述倾向性偏差为所述新的第一评分数据中的每个物品的热门度参数和推荐位展示历史参数中的一种；对于偶数迭代循环，所述倾向性偏差为所述新的第一评分数据中的每个物品的热门度参数和推荐位展示历史参数中的另一种。 9.根据权利要求1至3中任一项所述的推荐系统训练方法，其特征在于，所述倾向性偏差为所述新的第一评分数据中的每个物品的热门度参数和推荐位展示历史参数中的一种；在以预定的第一迭代条件迭代执行更新所述推荐系统的步骤之后，所述方法还包括以预定的第二迭代条件执行下述更新所述推荐系统的步骤：对于每个用户，利用所述推荐系统分别预测至少一个推荐物品；在所述第二评分数据中获取所述每个用户对所述推荐物品的评分，将所述评分加入到所述第一评分数据中，以得到新的第一评分数据；确定用户对所述新的第一评分数据中的每个物品的第二倾向性偏差，作为第二反倾向性系数，其中所述第二倾向性偏差为所述新的第一评分数据中的每个物品的热门度参数和推荐位展示历史参数中的另一种；基于含有第二反倾向性系数的目标函数，利用所述新的第一评分数据更新所述推荐系统。 10.根据权利要求1至3中任一项所述的推荐系统训练方法，其特征在于，所述由所述第一评分数据训练得到推荐系统，包括：屏蔽所述给定的用户物品评分数据中非第一评分数据的评分，获得基于所述第一评分数据的初始化评分数据，其中所述初始化评分数据为具有与所述给定的用户物品评分数据相同维度的稀疏矩阵；将所述初始化评分数据分解为用户数据和物品数据，利用所述用户数据和所述物品数据训练得到所述推荐系统。 11.根据权利要求1至 3中任一项所述的推荐系统训练方法，其特征在于，还包括：在所述给定的用户物品评分数据中针对每个用户选取第三评分数据，其中所述第三评分数据与所述第一评分数据不重叠；利用所述第三评分数据测试完成迭代的所述推荐系统。 12.一种推荐系统，其特征在于，所述推荐系统由根据权利要求1至11中任一项所述的推荐系统训练方法训练得到。 13.一种电子设备，其特征在于，包括：处理器和存储有计算机程序的存储器，所述处理器被配置成运行所述计算器程序时实现根据权利要求1至1 1中任一项所述的方法。权　利　要　求　书 2/3 页 3 CN 114297500 A 3

专利 推荐系统训练方法、推荐系统、电子设备及存储介质

专利推荐系统训练方法、推荐系统、电子设备及存储介质