说明:收录全文最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)中华 人民共和国 国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111645301.6 (22)申请日 2021.12.2 9 (71)申请人 完美世界 (北京) 软件科技发展 有限 公司 地址 100000 北京市海淀区上地 东路1号院 5号楼7层701-14 (72)发明人 杨辰灏 董博 (74)专利代理 机构 北京众达德权知识产权代理 有限公司 1 1570 代理人 张桂蓉 (51)Int.Cl. G06F 16/35(2019.01) G06N 20/00(2019.01) A63F 13/87(2014.01) (54)发明名称 评论文本分析方法、 模 型训练方法、 装置、 设 备及介质 (57)摘要 本发明公开了一种评论文本分析方法、 模 型 训练方法、 装置、 设备及介质, 应用于数据处理领 域, 所述方法包括: 获取针对目标对象的评论文 本; 通过M个情感分类模型分别对评论文本进行 情感分类预测, 得到评论文本的M个子情感分类 结果; 基于投票机制 处理所述M个子情感分类结 果, 得到评论文本的情感类别。 通过本发明技术 方案可以提高对于目标对象的评论文本的情感 分析准确性。 权利要求书3页 说明书14页 附图3页 CN 114297384 A 2022.04.08 CN 114297384 A 1.一种评论文本分析 方法, 其特 征在于, 包括: 获取针对目标对象的评论文本; 通过M个情 感分类模型分别对所述评论文本进行情 感分类预测, 得到所述评论文本的M 个子情感分类结果, 其中, 所述M个情感分类模型是由M个不同的样本数据子集一一对应训 练而成, M为大于2的整数; 基于投票机制处 理所述M个子情感分类结果, 得到所述评论文本的情感类别。 2.如权利要求1所述的方法, 其特征在于, 所述M个情感分类模型是基于同一原始模型 训练而成, 所述M个子情感分类结果包括由所述M个情感分类模型对应输出的M个情感标签; 所述基于投票机制处 理所述M个子情感分类结果, 得到所述评论文本的情感类别, 包括: 将所述M个情感分类模型中输出同一种情感标签的各个情感分类模型的投票权重进行 加和计算, 得到每种情感标签各自对应的加 和结果; 对比不同种情感标签对应的加 和结果, 确定出 所述评论文本的情感类别。 3.如权利要求1所述的方法, 其特征在于, 所述M个情感分类模型包括基于原始模型不 同划分的多个模型分组, 每一模型分组对应相同的原始模型, 且所述M个子情感分类结果包 括由所述M个情感分类模型对应输出的M个情感标签; 所述基于投票机制处理所述M个子情感分类结果, 得到所述评论文本的情感类别, 包 括: 针对每个模型分组, 将组内输出同一种情感标签的各个情感分类模型的投票权重进行 加和计算, 得到组内投票结果; 将每个模型分组 的组内投票结果以及投票权重进行加权和计算, 得到所述评论文本的 情感类别。 4.如权利要求1所述的方法, 其特征在于, 所述M个情感分类模型是基于同一原始模型 训练而成, 且所述M个子情感分类结果包括由所述M个情感分类模型对应输出 的M个子情感 概率; 所述基于投票机制处理所述M个子情感分类结果, 得到所述评论文本的情感类别, 包 括: 根据所述M个情 感分类模型各自的投票权重与所述M个子情 感概率进行加权和计算, 得 到所述评论文本的情感概 率; 根据所述情感概 率, 确定所述评论文本的情感类别。 5.如权利要求1所述的方法, 其特征在于, 所述M个情感分类模型包括基于原始模型不 同划分的多个模型分组, 每一模型分组对应相同的原始模型, 且所述M个子情感分类结果包 括由所述M个情感分类模型对应输出的M个子情感概 率; 所述基于投票机制处理所述M个子情感分类结果, 得到所述评论文本的情感类别, 包 括: 针对每个模型分组, 根据组内各个情感分类模型的投票权重与子情 感概率进行加权和 计算, 得到所述评论文本的组内情感判定结果, 并根据所述组内情感判定结果, 确定所述评 论文本的组内投票结果; 将每个模型分组 的组内投票结果以及投票权重进行加权和计算, 得到所述评论文本的 情感类别。 6.如权利要求1所述的方法, 其特征在于, 在得到所述评论文本的M个子情感分类结果权 利 要 求 书 1/3 页 2 CN 114297384 A 2之后, 还包括: 针对所述评论文本的M个情 感分类结果进行核验, 形成针对所述评论文本的核验记录, 所述核验记录用于表征 所述M个情感分类模型对所述评论文本的情感分类结果是否正确; 根据多条评论文本对应的核验记录, 形成核验数据集。 7.如权利要求6所述的方法, 其特 征在于, 在所述形成核验数据集之后, 还 包括: 分别将所述M个情感分类模型作为目标分类模型; 基于所述核验数据集对所述目标分类模型进行评估, 得到所述目标分类模型的历史误 判值; 采用与所述历史误判值对应的更新方式, 对所述目标分类模型和/或所述目标分类模 型的投票权 重进行更新。 8.如权利要求1 ‑7中任一所述的方法, 其特征在于, 所述方法还包括训练得到所述M个 情感分类模型的步骤: 根据获取的历史数据集构建K个不同的样本数据子集, K为大于或等于M的整数, 其中, 所述历史数据集包括游戏用户的历史评论文本; 利用所述K个不同的样本数据子集一一对应的对原始模型进行训练, 得到K个情 感分类 模型, 其中, 所述K个情感分类模型属于同一原 始模型或者多种不同原 始模型训练而成; 从所述K个情感分类模型中, 筛选出所述M个情感分类模型, 其中, 所述M个情感分类模 型包括基于原始模型不同划分的至少一个模型分组, 每个模型分组包括基于同一原始模型 训练而成的至少两个情感分类模型。 9.如权利要求8所述的方法, 其特征在于, 所述根据获取的历史数据集构建K个不同的 样本数据子集, 包括: 对所述历史数据集进行数据预处理, 得到原始样本数据集, 所述原始样本数据集中不 同标签的训练样本满足第一样本比例; 基于所述第一样本比例和第二样本比例, 确定每种标签的训练样本的采样方式, 所述 第二样本比例为样本数据子集中不同标签的训练样本满足的比例; 基于确定出的采样方式, 针对所述原始样本数据集执行采样, 得到K个不同的样本数据 子集。 10.一种文本分析模型训练方法, 其特 征在于, 包括: 根据获取的历史数据集构建K个不同的样本数据子集, K为大于或等于M的整数, 其中, 所述历史数据集包括用户的历史评论文本; 利用所述K个不同的样本数据子集一一对应的对原始模型进行训练, 得到K个情 感分类 模型, 其中, 所述K个情感分类模型基于同一原 始模型或者多种不同原 始模型训练而成; 从所述K个情感分类模型中, 筛选出M个情感分类模型, 其中, 所述M个情感分类模型包 括基于原始模型不同划分的至少一个模型分组, 每个模型分组包括基于同一原始模型训练 而成的至少两个情感分类模型。 11.一种评论文本分析装置, 其特 征在于, 包括: 文本获取 单元, 用于获取针对目标对象的评论文本; 分类预测单元, 用于通过M个情 感分类模型分别对所述评论文本进行情 感分类预测, 得 到所述评论文本的M个子情感分类结果, 其中, 所述M个情感分类模型是由M个不同的样本数权 利 要 求 书 2/3 页 3 CN 114297384 A 3
专利 评论文本分析方法、模型训练方法、装置、设备及介质
文档预览
中文文档
21 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 19:32:17
上传分享
举报
下载
原文档
(663.2 KB)
分享
友情链接
T-GCHA 1.3—2018 定制家居产品 人造板定制衣柜 第3部分:有害物质限量及气味等级.pdf
GB-T 23536-2022 超硬磨料 人造金刚石品种.pdf
GB-T 13989-2012 国家基本比例尺地形图分幅和编号.pdf
tc260 物联网安全标准化白皮书 2019.pdf
GB-T 36137-2018 中空纤维超滤膜和微滤膜组件完整性检验方法.pdf
GB-T 41580-2022 核与辐射应急响应人员的照射控制.pdf
T-JYBZ 002—2018 教育用音视频录播系统.pdf
gartner-magic-quadrant-for-access-management-august-2019.pdf
GM-T 0060-2018 签名验服务器检测规范.pdf
GB-T 40553-2021 塑料 适合家庭堆肥塑料技术规范.pdf
GM T 0131-2023 电子签章应用接口规范.pdf
GB-T 43697-2024 数据安全技术 数据分类分级规则.pdf
GB-T 33174-2016 资产管理 管理体系 GB-T 33173 应用指南.pdf
DB61-T 983-2015 旧水泥混凝土路面共振碎石化技术规范 陕西省.pdf
DB42-T 1726-2021 自然资源“一张图”数据应用服务规范 湖北省.pdf
GB-T 16638.1-2008 空气动力学 概念、量和符号 第1部分:空气动力学常用术语.pdf
GB-T 23853-2022 卤水碳酸锂.pdf
GB-T 7344-2015 交流伺服电动机通用技术条件.pdf
数据安全管理总纲.pdf
易观分析 AIGC产业研究报告2023——语言生成篇pdf.pdf
1
/
3
21
评价文档
赞助1.5元 点击下载(663.2 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。