专利 一种问答模型的训练方法及相关装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202211303983.7 (22)申请日 2022.10.24 (71)申请人中国农业银行股份有限公司地址 100005 北京市东城区建国门内大街 69号 (72)发明人李学亮　冯志强　石中玉　刘佳欣　 (74)专利代理机构北京集佳知识产权代理有限公司 11227 专利代理师曹伟 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/35(2019.01) G06F 40/295(2020.01) G06F 40/30(2020.01) G06F 40/58(2020.01)G06N 3/04(2006.01) G06N 3/08(2006.01) (54)发明名称一种问答模型的训练方法及相关装置 (57)摘要本申请提供了一种问答模型的训练方法及相关装置，该方法包括：先获取原始问题样本和对应的答案样本，答案样本为原始问题样本的正确答案；再对原始问题样本进行文本增强处理，得到对应的多个扩充问题样本，文本增强处理为改变原始问题样本的文本内容且不改变原始问题样本的文本语义；然后对多个扩充问题样本分别进行意图识别处理，确定多个扩充问题样本对应的问题领域；将多个扩充问题样本、多个扩充问题样本对应的问题领域和答案样本关联存储至问答模型的数据库。上述方案中，通过文本增强方式能够给问答模型提供大量的训练样本，且通过意图识别方式能够提高问答模型的准确性，即能够得到一种能准确识别用户意图且能准确回答的问答模型。权利要求书2页说明书8页附图5页 CN 115510215 A 2022.12.23 CN 115510215 A 1.一种问答模型的训练方法，其特征在于，包括：获取原始问题样本和对应的答案样本，所述答案样本为所述原始问题样本的正确答案；对所述原始问题样本进行文本增强处理，得到对应的多个扩充问题样本，所述文本增强处理为改变所述原始问题样本的文本内容且不改变所述原始问题样本的文本语义；对所述多个扩充问题样本分别进行意图识别处理，确定所述多个扩充问题样本对应的问题领域；将所述多个扩充问题样本、所述多个扩充问题样本对应的问题领域和所述答案样本关联存储至所述问答模型的数据库。 2.根据权利要求1所述的方法，其特征在于，所述对所述原始问题样本进行文本增强处理，得到对应的多个扩充问题样本，包括：基于所述原始问题样本的文字内容，对所述原始问题样本进行文本增强处理，得到多个第一扩充问题样本；将所述原始问题样本转换为问题向量样本；基于所述问题向量样本的向量内容，对所述问题向量样本进行文本增强处理，得到多个扩充向量样本；将所述多个扩充向量样本转换为第二扩充问题样本。 3.根据权利要求2所述的方法，其特征在于，所述基于所述原始问题样本的文字内容，对所述原始问题样本进行文本增强处理，得到多个第一扩充问题样本，包括：基于所述原始问题样本的文字内容，对所述原始问题样本进行多次反向翻译处理，得到多个第一扩充问题样本，所述反向翻译处理为将文字内容翻译为预设语种之后再翻译回原始语种。 4.根据权利要求1所述的方法，其特征在于，所述对所述多个扩充问题样本分别进行意图识别处理，确定所述多个扩充问题样本对应的问题领域，包括：对所述扩充问题样本进行文本嵌入，得到嵌入扩充问题样本；对所述嵌入扩充问题样本进行编码处理，得到编码扩充问题样本；对所述编码扩充问题样本进行特征提取，得到所述扩充问题样本对应的特征；对所述特征进行全连接处理，得到所述扩充问题样本对应的全局特征；对所述全局特征进行意图识别处理，确定所述扩充问题样本对应的问题领域。 5.根据权利要求1所述的方法，其特征在于，所述获取原始问题样本和对应的答案样本，包括：采用数据爬取方式获取所述原始问题样本和对应的所述答案样本。 6.根据权利要求1所述的方法，其特征在于，在确定所述多个扩充问题样本分别对应的问题领域之后，所述方法还包括：对所述扩充问题样本进行知识抽取处理，得到所述扩充问题样本对应的多个实体，以及所述多个实体之间的关系，所述实体为具有语义的词语；对所述多个实体进行知识融合处理并结合所述多个实体之间的关系，得到所述扩充问题样本对应的精简扩充问题样本，所述知识融合处理为将具有相同语义的实体进行融合；将所述精简扩充问题样本、所述扩充问题样本对应的问题领域和所述答案样本关联存权　利　要　求　书 1/2 页 2 CN 115510215 A 2储至所述问答模型的数据库。 7.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取目标问题，所述目标问题为待回答的问题；对所述目标问题进行意图识别处理，确定所述目标问题对应的问题领域；根据所述目标问题的问题领域和所述目标问题的文本内容，在所述问题模型的数据库中查询确定所述目标问题对应的目标答案。 8.一种问答模型的训练装置，其特征在于，包括：获取单元，用于获取原始问题样本和对应的答案样本，所述答案样本为所述原始问题样本的正确答案；文本增强单元，用于对所述原始问题样本进行文本增强处理，得到对应的多个扩充问题样本，所述文本增强处理为改变所述原始问题样本的文本内容且不改变所述原始问题样本的文本语义；意图识别单元，用于对所述多个扩充问题样本分别进行意图识别处理，确定所述多个扩充问题样本分别对应的问题领域；存储单元，用于将所述多个扩充问题样本、所述多个扩充问题样本分别对应的问题领域和所述答案样本关联存储至所述问答模型的数据库。 9.一种电子设备，其特征在于，包括：存储器，用于存储可执行指令；处理器，用于执行所述存储器中存储的可执行指令时，实现权利要求1至7任一项所述的方法。 10.一种计算机可读存储介质，其特征在于，存储有可执行指令，用于被处理器执行时，实现权利要求1至7任一项所述的方法。权　利　要　求　书 2/2 页 3 CN 115510215 A 3

专利 一种问答模型的训练方法及相关装置

专利一种问答模型的训练方法及相关装置