(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211294577.9
(22)申请日 2022.10.21
(71)申请人 深圳市快云科技有限公司
地址 518000 广东省深圳市前海深港合作
区前湾一路1号A栋201室(入驻深圳市
前海商务秘书 有限公司)
(72)发明人 张飞 周南 刘奇
(74)专利代理 机构 深圳市中科创为专利代理有
限公司 4 4384
专利代理师 尹益群 杨春
(51)Int.Cl.
G06F 16/33(2019.01)
G06F 40/216(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2022.01)G06N 3/04(2006.01)
G06N 3/08(2006.01)
G06Q 30/06(2012.01)
(54)发明名称
一种基于人工智能的关键词生成系统及方
法
(57)摘要
本发明提出一种基于人工智能的关键词生
成系统及方法, 方法包括: 获取商品描述数据, 并
从所述商品描述数据中提取第一搜索词; 根据所
述第一搜索词获取商品的潜在竞品数据; 利用图
像处理算法对 所述潜在竞品数据进行处理, 并过
滤掉相似度低于预设阈值的竞品的数据后得到
竞品数据; 从所述竞品数据中提取竞品标题数
据; 从所述竞品标题数据中提取核心商品词; 结
合预置的搜索词数据集, 从所述核心商品词中选
择出频率高于预设频率值的第一核心商品词; 根
据所述第一核心商品词, 结合关键词生成规则,
生成对应所述商品的关键词。 通过本方案, 能够
自动智能地采集竞品数据、 市场数据并自动编辑
商品关键词, 大量减少人工操作, 提升生成商品
文案的效率。
权利要求书5页 说明书16页 附图4页
CN 115470322 A
2022.12.13
CN 115470322 A
1.一种基于人工智能的关键词生成系统, 其特征在于, 包括: 提取模块、 数据处理模块
和生成模块;
所述提取模块被 配置为:
获取商品描述数据, 并从所述商品描述数据中提取第一搜索词;
根据所述第一搜索词获取商品的潜在竞品数据;
所述数据处 理模块, 被 配置为:
利用图像处理算法对所述潜在竞品数据进行处理, 并过滤掉相似度低于预设阈值的竞
品的数据后得到竞品数据;
从所述竞品数据中提取竞品标题数据;
从所述竞品标题数据中提取核心商品词;
结合预置的搜索词数据集, 从所述核心商品词中选择出频率高于预设频率值的第 一核
心商品词;
所述生成模块被配置为: 根据 所述第一核心商品词, 结合关键词生成规则, 生成对应所
述商品的关键词。
2.根据权利要求1所述的基于人工智能的关键词生成系统, 其特征在于, 在所述利用图
像处理算法对所述潜在竞品数据进行 处理, 并过滤掉相似度低于预设阈值的竞品的数据后
得到竞品数据的步骤中, 所述数据处 理模块具体 被配置为:
输入所述潜在竞品数据, 将相似度标识值 I记为0;
利用第一相似度判断模型判断所述潜在竞品数据的第一相似值A1是否大于第一阈值;
若所述第 一相似值A1大于所述第 一阈值, 则利用第 二相似度判断模型判断所述潜在竞
品数据的第二相似值A2是否小于第二阈值, 以及利用第三相似度判断模型判断所述潜在竞
品数据的第三相似值A3是否小于第三阈值;
若所述第二相似值A2小于所述第二阈值或者所述第三相似值A3小于所述第三阈值, 则
将所述相似度标识值 I加1, 并利用第一相似度计算方法计算第一相似度S1;
若所述第二相似值A2不小于所述第二阈值或者所述第三相似值A3不小于所述第三阈
值, 则利用所述第一相似度计算方法计算所述第一相似度S1;
所述第一相似度计算方法为: 第一相似度S1=a1*第一相似值A1+a2*第二相似值A2+
a3*第三相似值A3+b1*相似度标识值I, 其中, a1、 a2、 a3、 b1均为大于0的权重系数且a1+a2+
a3+b1=1
若所述第 一相似值A1不大于所述第 一阈值, 则利用图像处理算法对所述潜在竞品数据
中的图像数据进行处 理, 得到潜在竞品图像数据;
利用第四相似度判断模型判断所述潜在竞品图像数据的第 四相似值A4是否小于第 四
阈值, 以及利用第五相似度判断模型判断所述潜在竞品图像数据的第五相似值A5是否小于
第五阈值;
若所述第 四相似值A4不小于所述第 四阈值或者所述第五相似值A5不小于所述第五阈
值, 则将所述相似度标识值 I加1, 并利用第二相似度计算方法计算第二相似度S2;
若所述第四相似值A4小于所述第四阈值或者所述第五相似值A5小于所述第五阈值, 则
利用所述第二相似度计算方法计算所述第二相似度S2;
所述第二相似度计算方法为: 第二相似度S2=a6*第一相似值A1+a4*第四相似值A4+权 利 要 求 书 1/5 页
2
CN 115470322 A
2a5*第五相似值A5+b2*相似度标识值I, 其中, a4、 a5、 a6、 b2均为大于0的权重系数且a4+a5+
a6+b2=1;
判断所述第一相似度S1或所述第二相似度S2是否不小于所述预设阈值, 若是, 则将所
述潜在竞品数据标记为相似, 若否, 则将所述潜在竞品数据标记为 不相似;
将所述潜在竞品数据中所有被标记为相似的数据提取 出来作为所述 竞品数据。
3.根据权利要求2所述的基于人工智能的关键词生成系统, 其特征在于, 在所述获取商
品描述数据, 并从所述商品描述数据中提取第一搜索词的步骤中, 所述提取模块具体被配
置为:
步骤一: 对所述商品描述数据按商品名称、 商品属性进行分类, 并对分类后的所述商品
描述数据进行文本预处 理后生成候选 搜索词序列;
步骤二: 提取所述候选搜索词序列的特征数据, 并对所述特征数据进行标注得到有标
注样本集和无 标注样本集;
步骤三: 将所述标注样本集作为训练集 合, 利用神经网络训练搜索词分类模型;
步骤四: 用训练好的所述搜索词分类模型对所述无标注样本集中的候选搜索词 进行分
类预测, 并计算每 个无标注样本的匹配度;
步骤五: 选取所述匹配度超过预设匹配度值的对应的所述无标注样本加入所述训练集
合, 重新训练所述搜索词分类模型;
步骤六: 重复步骤四至步骤五, 直至所有所述每个无标注样本的匹配度中高于所述预
设匹配度值的比例超过 预设比例, 得到最终的搜索词分类模型;
步骤七: 所述商品描述数据的特征数据输入所述最终的搜索词分类模型处理, 并从处
理结果中提取 所述第一搜索词。
4.根据权利要求3所述的基于人工智能的关键词生成系统, 其特征在于, 所述步骤一:
对所述商品描述数据按商品名称、 商品属 性进行分类, 并对分类后的所述商品描述数据进
行文本预处 理后生成候选 搜索词序列中, 所述 提取模块具体 被配置为:
从所述商品描述数据中提取文本数据;
对所述文本数据中的所有语句进行统计和编号;
将所述语句分割成多个词语, 记录所述词语在所述语句中的位置信息;
分析并标注所述词语的词性;
从所述词语中删除预设词性的第一词语, 得到修改后的词语集;
对所述修改后的词语集进行去重操作, 得到候选词集 合;
将所述候选词集 合按商品名称、 商品属性进行分类;
对分类后的所述 候选词集 合进行文本预处 理后生成所述 候选搜索词序列。
5.根据权利要求1 ‑4所述的基于人工智能的关键词生成系统, 其特征在于, 所述步骤二
中所述提取所述候选搜索词序列的特 征数据的操作中, 所述 提取模块具体 被配置为:
利用已训练好的词向量模型, 生成第一词向量表;
根据所述第一词向量表, 生成与所述 候选搜索词序列对应的候选 搜索词向量序列;
根据所述候选搜索词向量序列之间的距离, 将所述候选搜索词向量序列划分成n个集
群;
根据聚类算法生成所述 n个集群的聚类中心向量;权 利 要 求 书 2/5 页
3
CN 115470322 A
3
专利 一种基于人工智能的关键词生成系统及方法
文档预览
中文文档
26 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共26页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-18 22:24:22上传分享