(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211303983.7
(22)申请日 2022.10.24
(71)申请人 中国农业银行股份有限公司
地址 100005 北京市东城区建国门内大街
69号
(72)发明人 李学亮 冯志强 石中玉 刘佳欣
(74)专利代理 机构 北京集佳知识产权代理有限
公司 11227
专利代理师 曹伟
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 16/35(2019.01)
G06F 40/295(2020.01)
G06F 40/30(2020.01)
G06F 40/58(2020.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
(54)发明名称
一种问答模型的训练方法及相关装置
(57)摘要
本申请提供了一种 问答模型的训练方法及
相关装置, 该方法包括: 先获取原始问题样本和
对应的答案样本, 答案样本为原始问题样本的正
确答案; 再对原始问题样本进行文本增强处理,
得到对应的多个扩充问题样本, 文本增强处理为
改变原始问题样本的文本内容且不改变原始问
题样本的文本语义; 然后对多个扩充问题样本分
别进行意图识别处理, 确定多个扩充问题样本对
应的问题领域; 将多个扩充问题样本、 多个扩充
问题样本对应的问题领域和答案样本关联存储
至问答模型的数据库。 上述方案中, 通过文本增
强方式能够给问答模型提供大量的训练样本, 且
通过意图识别方式能够提高问答模 型的准确性,
即能够得到一种能准确识别用户意图且能准确
回答的问答模型。
权利要求书2页 说明书8页 附图5页
CN 115510215 A
2022.12.23
CN 115510215 A
1.一种问答模型的训练方法, 其特 征在于, 包括:
获取原始问题样本和对应的答案样本, 所述答案样本为所述原始问题样本的正确答
案;
对所述原始问题样本进行文本增强处理, 得到对应的多个扩充问题样本, 所述文本增
强处理为改变所述原 始问题样本的文本内容且不改变所述原 始问题样本的文本语义;
对所述多个扩充问题样本分别进行意图识别处理, 确定所述多个扩充问题样本对应的
问题领域;
将所述多个扩充问题样本、 所述多个扩充问题样本对应的问题领域和所述答案样本关
联存储至所述问答模型的数据库。
2.根据权利要求1所述的方法, 其特征在于, 所述对所述原始问题样本进行文本增强处
理, 得到对应的多个扩充问题样本, 包括:
基于所述原始问题样本的文字内容, 对所述原始问题样本进行文本增强处理, 得到多
个第一扩充问题样本;
将所述原 始问题样本转换为问题向量样本;
基于所述问题向量样本的向量内容, 对所述问题向量样本进行文本增强处理, 得到多
个扩充向量样本;
将所述多个扩充向量样本转换为第二扩充问题样本 。
3.根据权利要求2所述的方法, 其特征在于, 所述基于所述原始问题样本的文字内容,
对所述原 始问题样本进行文本增强处 理, 得到多个第一扩充问题样本, 包括:
基于所述原始问题样本的文字内容, 对所述原始问题样本进行多次反向翻译处理, 得
到多个第一扩充问题样 本, 所述反向翻译处理为将文字内容翻译为预设语种之后再翻译回
原始语种。
4.根据权利要求1所述的方法, 其特征在于, 所述对所述多个扩充问题样本分别进行意
图识别处 理, 确定所述多个扩充问题样本对应的问题领域, 包括:
对所述扩充问题样本进行文本嵌入, 得到嵌入 扩充问题样本;
对所述嵌入 扩充问题样本进行编码处 理, 得到编码扩充问题样本;
对所述编码扩充问题样本进行 特征提取, 得到所述扩充问题样本对应的特 征;
对所述特 征进行全连接处 理, 得到所述扩充问题样本对应的全局特 征;
对所述全局特 征进行意图识别处 理, 确定所述扩充问题样本对应的问题领域。
5.根据权利要求1所述的方法, 其特征在于, 所述获取原始问题样本和对应的答案样
本, 包括:
采用数据爬取 方式获取 所述原始问题样本和对应的所述 答案样本 。
6.根据权利要求1所述的方法, 其特征在于, 在确定所述多个扩充问题样本分别对应的
问题领域之后, 所述方法还 包括:
对所述扩充问题样本进行知识抽取处理, 得到所述扩充问题样本对应的多个实体, 以
及所述多个实体之间的关系, 所述实体为具有语义的词语;
对所述多个实体进行知识融合处理并结合所述多个实体之间的关系, 得到所述扩充问
题样本对应的精简扩充问题样本, 所述知识融合处 理为将具有相同语义的实体进行融合;
将所述精简扩充问题样本、 所述扩充问题样本对应的问题领域和所述答案样本关联存权 利 要 求 书 1/2 页
2
CN 115510215 A
2储至所述问答模型的数据库。
7.根据权利要求1所述的方法, 其特 征在于, 所述方法还 包括:
获取目标问题, 所述目标问题为待回答的问题;
对所述目标问题进行意图识别处 理, 确定所述目标问题对应的问题领域;
根据所述目标问题的问题领域和所述目标问题的文本 内容, 在所述问题模型的数据库
中查询确定所述目标问题对应的目标答案 。
8.一种问答模型的训练装置, 其特 征在于, 包括:
获取单元, 用于获取原始问题样本和对应的答案样本, 所述答案样本为所述原始问题
样本的正确答案;
文本增强单元, 用于对所述原始问题样本进行文本增强处理, 得到对应的多个扩充问
题样本, 所述文本增强处理为改变所述原始问题样本的文本内容且不改变所述原始问题样
本的文本语义;
意图识别单元, 用于对所述多个扩充问题样本分别进行意图识别处理, 确定所述多个
扩充问题样本分别对应的问题领域;
存储单元, 用于将所述多个扩充问题样本、 所述多个扩充问题样本分别对应的问题领
域和所述 答案样本关联存 储至所述问答模型的数据库。
9.一种电子设备, 其特 征在于, 包括:
存储器, 用于存 储可执行指令;
处理器, 用于执行所述存储器中存储的可执行指令时, 实现权利要求1至7任一项所述
的方法。
10.一种计算机可读存储介质, 其特征在于, 存储有可执行指令, 用于被处理器执行时,
实现权利要求1至7任一项所述的方法。权 利 要 求 书 2/2 页
3
CN 115510215 A
3
专利 一种问答模型的训练方法及相关装置
文档预览
中文文档
16 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共16页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:19上传分享