(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210867251.4
(22)申请日 2022.07.22
(71)申请人 支付宝 (杭州) 信息技 术有限公司
地址 310000 浙江省杭州市西湖区西溪路
556号8层B段801-1 1
(72)发明人 王昊天 吴晓烽 王维强
(74)专利代理 机构 北京国昊天诚知识产权代理
有限公司 1 1315
专利代理师 朱文杰
(51)Int.Cl.
G06Q 10/06(2012.01)
G06F 16/33(2019.01)
G06F 16/332(2019.01)
G06F 16/338(2019.01)
G06Q 40/02(2012.01)
(54)发明名称
数据处理方法、 装置及设备
(57)摘要
本说明书实施例提供了一种数据处理方法、
装置及设备, 所述方法包括: 在检测到目标用户
触发执行目标业务的情况下, 基于获取的目标信
息, 确定与所述目标信息对应的第一特征向量,
所述目标信息包括所述目标用户触发执行所述
目标业务所需的信息, 和/或所述目标用户针对
触发执行所述目标业务的交互信息; 基于待输出
的候选话术的频次信息、 匹配信息和第一信息,
确定每个所述候选话术对应的第二特征向量; 基
于所述第一特征向量和所述第二特征向量, 确定
每个所述候选话术与所述目标用户触发执行所
述目标业务的匹配度; 基于所述匹配度, 确定所
述候选话术中与所述目标用户触发执行所述目
标业务匹配的目标话 术, 并输出 所述目标话 术。
权利要求书3页 说明书16页 附图5页
CN 115222262 A
2022.10.21
CN 115222262 A
1.一种数据处 理方法, 包括:
在检测到目标用户触发执行目标业务的情况下, 基于获取的目标信息, 确定与所述目
标信息对应的第一特征向量, 所述目标信息包括所述目标用户触发执行所述目标业务所需
的信息, 和/或所述目标用户针对触发执 行所述目标业 务的交互信息;
基于待输出的候选话术的频次信息、 匹配信息和第一信息, 确定每个所述候选话术对
应的第二特征向量, 所述频次信息基于预设检测周期内的举报信息以及所述举报信息中与
所述候选话术对应的举报信息确定, 所述匹配信息用于表征所述候选话术与所述目标用户
以及预设风险类型的匹配程度, 所述第一信息基于对所述目标信息进 行意图识别处理得到
意图类型确定;
基于所述第 一特征向量和所述第 二特征向量, 确定每个所述候选话术与所述目标用户
触发执行所述目标业 务的匹配度;
基于所述匹配度, 确定所述候选话术中与 所述目标用户触发执行所述目标业务匹配的
目标话术, 并输出 所述目标话 术。
2.根据权利要求1所述的方法, 所述方法还 包括:
获取所述目标用户针对所述目标话 术的反馈信息;
基于所述目标话术、 所述反馈信息以及预先训练的风险分值确定模型, 确定所述反馈
信息对应的风险分值, 所述风险分值确定模型为基于历史话术、 历史反馈信息对由预设机
器学习算法构建的模型进行训练得到;
基于所述目标话术和所述反馈信 息对应的风险分值, 确定所述目标用户触发执行所述
目标业务是否存在风险。
3.根据权利要求2所述的方法, 所述基于待输出的候选话术的频次信 息、 匹配信 息和第
一信息, 确定每 个所述候选话术对应的第二特 征向量, 包括:
基于所述待输出的候选话术的频次信息、 所述匹配信息、 所述第一信息以及预先训练
的第二向量 提取模型, 确定每 个所述候选话术对应的第一子特 征向量;
对所述候选话术的话术内容进行特征提取处理, 确定每个所述候选话术对应的第 二子
特征向量;
基于所述第 一子特征向量和所述第 二子特征向量, 确定每个所述候选话术对应的第 二
特征向量。
4.根据权利要求3所述的方法, 在所述基于待输出的候选话术的频次信 息、 匹配信 息和
第一信息, 确定每 个所述候选话术对应的第二特 征向量之前, 还 包括:
获取所述预设检测周期内的举报信息的第一数量;
确定所述举报信息中与所述 候选话术对应的举报信息的第二数量;
基于所述第一数量和所述第二数量, 确定每 个所述候选话术的频次信息 。
5.根据权利要求4所述的方法, 在所述基于待输出的候选话术的频次信 息、 匹配信 息和
第一信息, 确定每 个所述候选话术对应的第二特 征向量之前, 还 包括:
基于所述目标信 息和预先训练 的概率确定模型, 确定所述目标用户与每个所述预设风
险类型对应的第一概率, 所述概率确定模型为基于历史信息对由预设机器学习算法构建的
模型进行训练得到;
基于所述举报信 息中与所述候选话术对应的举报信 息, 确定所述候选话术与每个所述权 利 要 求 书 1/3 页
2
CN 115222262 A
2预设风险类型对应的第二 概率;
基于所述第一 概率和所述第二 概率, 确定每 个所述候选话术的匹配信息 。
6.根据权利要求5所述的方法, 所述基于所述举报信息中与所述候选话术对应的举报
信息, 确定所述 候选话术与每个所述预设风险类型对应的第二 概率, 包括:
获取所述举报信 息中与所述候选话术对应的举报信 息中, 与每个所述预设风险类型对
应的举报信息的第三数量;
基于所述第 二数量和所述第 三数量, 确定所述候选话术与每个所述预设风险类型对应
的第二概率。
7.根据权利要求6所述的方法, 在所述基于待输出的候选话术的频次信 息、 匹配信 息和
第一信息, 确定每 个所述候选话术对应的第二特 征向量之前, 还 包括:
基于预先训练的意图识别模型, 对所述目标信息进行意图识别处理, 得到所述目标信
息对应的意图类型, 并确定每个所述候选话术与所述目标信息对应的意图类型的匹配程
度;
将每个所述候选话术与所述目标信息对应的意图类型的匹配程度确定为每个所述候
选话术的第一信息 。
8.根据权利要求7所述的方法, 所述基于所述第 一特征向量和所述第 二特征向量, 确定
每个所述候选话术与所述目标用户触发执 行所述目标业 务的匹配度, 包括:
基于预先训练的相似度确定模型、 所述第一特征向量和所述第二特征向量, 确定所述
第一特征向量和所述第二特征向量之间的相似度, 并基于所述相似度, 确定每个所述候选
话术与所述目标用户触发执 行所述目标业 务的匹配度。
9.一种数据处 理装置, 包括:
第一获取模块, 用于在检测到目标用户触发执行目标业务的情况下, 基于获取的目标
信息, 确定与所述 目标信息对应的第一特征向量, 所述 目标信息包括所述 目标用户触发执
行所述目标业 务所需的信息, 和/或所述目标用户针对触发执 行所述目标业 务的交互信息;
第一确定模块, 用于基于待输出的候选话术的频次信息、 匹配信 息和第一信息, 确定每
个所述候选话术对应的第二特征向量, 所述频次信息基于预设检测周期内的举报信息以及
所述举报信息中与所述候选话术对应的举报信息确定, 所述匹配信息用于表征所述候选话
术与所述目标用户以及预设风险类型的匹配程度, 所述第一信息基于对所述目标信息进 行
意图识别处 理得到意图类型确定;
第二确定模块, 用于基于所述第一特征向量和所述第二特征向量, 确定每个所述候选
话术与所述目标用户触发执 行所述目标业 务的匹配度;
话术确定模块, 用于基于所述匹配度, 确定所述候选话术中与所述目标用户触发执行
所述目标业 务匹配的目标话 术, 并输出 所述目标话 术。
10.一种数据处 理设备, 所述数据处 理设备包括:
处理器; 以及
被安排成存储计算机可执行指令的存储器, 所述可执行指令在被执行时使所述处理
器:
在检测到目标用户触发执行目标业务的情况下, 基于获取的目标信息, 确定与所述目
标信息对应的第一特征向量, 所述目标信息包括所述目标用户触发执行所述目标业务所需权 利 要 求 书 2/3 页
3
CN 115222262 A
3
专利 数据处理方法、装置及设备
文档预览
中文文档
25 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共25页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-03-03 12:22:42上传分享