说明:收录全文最新的团体标准 提供单次或批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111652923.1 (22)申请日 2021.12.3 0 (71)申请人 胜斗士 (上海) 科技 技术发展有限公 司 地址 201204 上海市浦东 新区牡丹路60号 10-11层 (72)发明人 张卿 袁云滔 王姜 潘雄飞  (74)专利代理 机构 北京市金杜律师事务所 11256 代理人 庞淑敏 (51)Int.Cl. G06N 20/00(2019.01) (54)发明名称 训练机器学习模型的方法、 预测方法、 计算 设备和介质 (57)摘要 本公开提供了一种用于训练针对目标对象 的机器学习模 型的方法、 预测目标对象的销售额 的方法、 计算设备和计算机可读存储介质。 该方 法包括: 获取多个目标对象在 多个单位时间的时 序数据集合, 所述时序数据集合包括每个目标对 象在每个单位时间的多个特征值; 沿主键方向对 所述时序数据集合分段以产生多个主键分段; 沿 时间方向对每个主键分段进行分段以产生多个 特征数据集文件, 其中每个特征数据集文件包括 所述至少两个目标对象在一个第一时间段的时 序数据, 并且所述第一时间段包括多个单位时 间; 以及根据第二时间段内的特征数据集文件 得 到对所述机器学习模型进行训练的训练数据集, 其中所述第二时间段包括多个第一时间段。 权利要求书2页 说明书12页 附图6页 CN 114372579 A 2022.04.19 CN 114372579 A 1.一种用于训练针对目标对象的机器学习模型的方法, 包括: 获取多个目标对象在多个单位 时间的时序 数据集合, 所述 时序数据集合包括每个目标 对象在每 个单位时间的多个特 征值; 沿主键方向对所述 时序数据集合分段以产生多个主键分段, 其中每个主键分段包括所 述多个目标对象中的至少两个目标对象的时序数据; 沿时间方向对每个主键分段进行分段以产生多个特征数据集文件, 其中每个特征数据 集文件包括所述至少两个目标对象在一个第一时间段的时序数据, 并且所述第一时间段包 括多个单位时间; 以及 根据第二时间段内的特征数据集文件得到对所述机器学习模型进行训练的训练数据 集, 其中所述第二时间段包括多个第一时间段。 2.如权利要求1所述的方法, 还 包括: 对于每个主键分段, 获取所述主键分段所包括的至少两个目标对象在增量第 一时间段 的增量时序数据; 为所述增量时序数据 产生增量特 征数据集文件; 以及 利用所述增量特征数据集文件替换所述第二时间段内的特征数据集文件以作为下一 训练数据集对所述机器学习模型进行迭代训练。 3.如权利要求1或2所述的方法, 还 包括: 存储所述多个特征数据集文件的第 一元数据信 息, 所述第 一元数据信 息指示每个主键 分段和所述主键分段 所包含的至少两个目标对象之间的对应关系; 在每个主键分段下存储所述主键分段的第 二元数据信 息, 所述第 二元数据信 息指示所 述主键分段 下的第一时间段与特 征数据集文件之间的对应关系; 以及 在所述每 个主键分段 下存储所述主键分段 下的特征数据集文件。 4.如权利要求3所述的方法, 其中在所述第 一元数据信 息中, 所述多个主键分段随机排 列。 5.如权利要求3所述的方法, 其中在所述第 一元数据信 息中, 所述多个主键分段基于主 键分段的顺序排列。 6.如权利要求1或2所述的方法, 还 包括: 以特征值为行, 主键为列的方式存储每个特征数据集文件, 并且其中, 根据第 二时间段 内的特征数据集文件得到对所述机器学习模型进行训练的训练数据集包括: 在要将所述第二时间段所包含的多个第一时间段内的特征数据集文件读取到内存中 的情况下, 直接将每个特征数据集文件的特征值沿着列的方向合并, 并且在合并完成后进 行行列转换以产生所述机器学习模型的训练数据集。 7.如权利要求1或2所述的方法, 还 包括: 以主键为行, 特征值为列的方式存储每个特征数据集文件, 并且其中, 根据第 二时间段 内的特征数据集文件得到对所述机器学习模型进行训练的训练数据集包括: 在要将所述第二时间段所包含的多个第一时间段内的特征数据集文件读取到内存中 的情况下, 将每个特征数据集文件的每个时序数据的多个特征值进行行列转换, 并将转换 后的特征数据集文件沿着行的方向扩展以产生所述机器学习模型的训练数据集。 8.如权利要求1所述的方法, 其中所述目标对象包括连锁门店, 所述特征值包括所述连权 利 要 求 书 1/2 页 2 CN 114372579 A 2锁门店的经 营数据。 9.一种用于预测目标对象的销售额的方法, 包括: 获取所述目标对象在多个单位时间的特 征数据作为输入数据; 以及 将所述输入数据输入经由权利要求1至8中任一项所述的方法训练后的机器学习模型 以根据所述输入数据生成关于所述目标对象的销售额的预测结果。 10.一种计算设备, 包括: 至少一个处 理器; 以及 至少一个存储器, 所述至少一个存储器被耦合到所述至少一个处理器并且存储用于由 所述至少一个处理器执行 的指令, 所述指令当由所述至少一个处理器执行时, 使得所述计 算设备执行根据权利要求1至9中任一项所述的方法的步骤。 11.一种计算机可读存储介质, 其上存储有计算机程序代码, 所述计算机程序代码在被 运行时执 行如权利要求1至9中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114372579 A 3

.PDF文档 专利 训练机器学习模型的方法、预测方法、计算设备和介质

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 训练机器学习模型的方法、预测方法、计算设备和介质 第 1 页 专利 训练机器学习模型的方法、预测方法、计算设备和介质 第 2 页 专利 训练机器学习模型的方法、预测方法、计算设备和介质 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 19:32:16上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。