说明:收录全文最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111652923.1 (22)申请日 2021.12.3 0 (71)申请人 胜斗士 (上海) 科技 技术发展有限公 司 地址 201204 上海市浦东 新区牡丹路60号 10-11层 (72)发明人 张卿 袁云滔 王姜 潘雄飞 (74)专利代理 机构 北京市金杜律师事务所 11256 代理人 庞淑敏 (51)Int.Cl. G06N 20/00(2019.01) (54)发明名称 训练机器学习模型的方法、 预测方法、 计算 设备和介质 (57)摘要 本公开提供了一种用于训练针对目标对象 的机器学习模 型的方法、 预测目标对象的销售额 的方法、 计算设备和计算机可读存储介质。 该方 法包括: 获取多个目标对象在 多个单位时间的时 序数据集合, 所述时序数据集合包括每个目标对 象在每个单位时间的多个特征值; 沿主键方向对 所述时序数据集合分段以产生多个主键分段; 沿 时间方向对每个主键分段进行分段以产生多个 特征数据集文件, 其中每个特征数据集文件包括 所述至少两个目标对象在一个第一时间段的时 序数据, 并且所述第一时间段包括多个单位时 间; 以及根据第二时间段内的特征数据集文件 得 到对所述机器学习模型进行训练的训练数据集, 其中所述第二时间段包括多个第一时间段。 权利要求书2页 说明书12页 附图6页 CN 114372579 A 2022.04.19 CN 114372579 A 1.一种用于训练针对目标对象的机器学习模型的方法, 包括: 获取多个目标对象在多个单位 时间的时序 数据集合, 所述 时序数据集合包括每个目标 对象在每 个单位时间的多个特 征值; 沿主键方向对所述 时序数据集合分段以产生多个主键分段, 其中每个主键分段包括所 述多个目标对象中的至少两个目标对象的时序数据; 沿时间方向对每个主键分段进行分段以产生多个特征数据集文件, 其中每个特征数据 集文件包括所述至少两个目标对象在一个第一时间段的时序数据, 并且所述第一时间段包 括多个单位时间; 以及 根据第二时间段内的特征数据集文件得到对所述机器学习模型进行训练的训练数据 集, 其中所述第二时间段包括多个第一时间段。 2.如权利要求1所述的方法, 还 包括: 对于每个主键分段, 获取所述主键分段所包括的至少两个目标对象在增量第 一时间段 的增量时序数据; 为所述增量时序数据 产生增量特 征数据集文件; 以及 利用所述增量特征数据集文件替换所述第二时间段内的特征数据集文件以作为下一 训练数据集对所述机器学习模型进行迭代训练。 3.如权利要求1或2所述的方法, 还 包括: 存储所述多个特征数据集文件的第 一元数据信 息, 所述第 一元数据信 息指示每个主键 分段和所述主键分段 所包含的至少两个目标对象之间的对应关系; 在每个主键分段下存储所述主键分段的第 二元数据信 息, 所述第 二元数据信 息指示所 述主键分段 下的第一时间段与特 征数据集文件之间的对应关系; 以及 在所述每 个主键分段 下存储所述主键分段 下的特征数据集文件。 4.如权利要求3所述的方法, 其中在所述第 一元数据信 息中, 所述多个主键分段随机排 列。 5.如权利要求3所述的方法, 其中在所述第 一元数据信 息中, 所述多个主键分段基于主 键分段的顺序排列。 6.如权利要求1或2所述的方法, 还 包括: 以特征值为行, 主键为列的方式存储每个特征数据集文件, 并且其中, 根据第 二时间段 内的特征数据集文件得到对所述机器学习模型进行训练的训练数据集包括: 在要将所述第二时间段所包含的多个第一时间段内的特征数据集文件读取到内存中 的情况下, 直接将每个特征数据集文件的特征值沿着列的方向合并, 并且在合并完成后进 行行列转换以产生所述机器学习模型的训练数据集。 7.如权利要求1或2所述的方法, 还 包括: 以主键为行, 特征值为列的方式存储每个特征数据集文件, 并且其中, 根据第 二时间段 内的特征数据集文件得到对所述机器学习模型进行训练的训练数据集包括: 在要将所述第二时间段所包含的多个第一时间段内的特征数据集文件读取到内存中 的情况下, 将每个特征数据集文件的每个时序数据的多个特征值进行行列转换, 并将转换 后的特征数据集文件沿着行的方向扩展以产生所述机器学习模型的训练数据集。 8.如权利要求1所述的方法, 其中所述目标对象包括连锁门店, 所述特征值包括所述连权 利 要 求 书 1/2 页 2 CN 114372579 A 2锁门店的经 营数据。 9.一种用于预测目标对象的销售额的方法, 包括: 获取所述目标对象在多个单位时间的特 征数据作为输入数据; 以及 将所述输入数据输入经由权利要求1至8中任一项所述的方法训练后的机器学习模型 以根据所述输入数据生成关于所述目标对象的销售额的预测结果。 10.一种计算设备, 包括: 至少一个处 理器; 以及 至少一个存储器, 所述至少一个存储器被耦合到所述至少一个处理器并且存储用于由 所述至少一个处理器执行 的指令, 所述指令当由所述至少一个处理器执行时, 使得所述计 算设备执行根据权利要求1至9中任一项所述的方法的步骤。 11.一种计算机可读存储介质, 其上存储有计算机程序代码, 所述计算机程序代码在被 运行时执 行如权利要求1至9中任一项所述的方法。权 利 要 求 书 2/2 页 3 CN 114372579 A 3
专利 训练机器学习模型的方法、预测方法、计算设备和介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 19:32:16
上传分享
举报
下载
原文档
(935.3 KB)
分享
友情链接
GB-T 40665.1-2021 中医四诊操作规范 第1部分:望诊.pdf
GB-T 32570-2016 集装箱用钢板及钢带.pdf
信创产业发展研究报告 2022.pdf
GB-T 42592-2023 风力发电机组 风轮叶片超声波检测方法.pdf
OWASP 软件保证成熟度模型 v1.0 中文版 SAMM-1.0-cn.pdf
GB-T 6490-2021 水轮泵.pdf
民航 MH-T 6016-2017 航空食品车.pdf
GB-T 20271-2006 信息安全技术 信息系统通用安全技术要求.pdf
DB5301-T 82-2023 农业废弃物 冷库蔬菜废弃物处置规范 昆明市.pdf
ISO IEC 27701-2019 中文版.pdf
DB34-T 4686-2024 挥发性有机物走航监测技术规范 安徽省.pdf
GB-T 40659-2021 智能制造 机器视觉在线检测系统 通用要求.pdf
DB34-T 5037-2022 船闸工程施工安全检查标准 安徽省.pdf
GB-T 21286-2007 充气轮胎修补.pdf
YD-T 4047.3-2022 分布式中间件服务技术能力要求 第3部分:API网关.pdf
GB-T 25205-2010 雨淋喷头.pdf
NY-T 1236-2006 绵、山羊生产性能测定技术规范.pdf
YD-T 1754-2008 电信网和互联网物理环境安全等级保护要求.pdf
T-ZZB 1236—2019 汽车减振器用轴承及其单元.pdf
TTAF 150—2023 移动互联网应用人工智能模型安全指南.pdf
1
/
3
21
评价文档
赞助1.5元 点击下载(935.3 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。