文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210329999.9 (22)申请日 2022.03.31 (71)申请人 南京众智维信息科技有限公司 地址 211300 江苏省南京市高淳区龙井路3 号 (72)发明人 孙捷 车洵 胡牧 孙翰墨 (74)专利代理 机构 南京知识律师事务所 32 207 专利代理师 张苏沛 (51)Int.Cl. G06F 16/332(2019.01) G06F 16/335(2019.01) G06F 40/126(2020.01) G06F 40/279(2020.01) G06F 40/30(2020.01) G06N 3/04(2006.01)G06N 3/08(2006.01) (54)发明名称 多级自注意力的网络安全协同处置作战室 语义摘要方法 (57)摘要 本发明公开了一种多级自注意力的网络安 全协同处置作战室语义摘要 方法, 给定一段网络 安全协同处置作 战室聊天记录, 包括步骤: 记录 网络安全协同处置作战室运营过程形成语料库; 将语料库中的文本内容通过词向量矩 阵转换成 标记向量, 拼接标记向量、 语句分段向量和位置 向量形成完整的词向量作为网络结构的输入; 将 输出结果送入变压器的编码器; 把结果输入到变 压器包含注 意力机制的模块中, 实现对文本中重 复冗余内容的排除; 通过变压器模 型中的解码器 生成语义摘要; 根据权重较大的k个关键词输出 文本对应的语义摘要, 形成任务指令; 简化运营 记录, 生成简洁流畅的摘要 任务。 权利要求书3页 说明书8页 附图2页 CN 114490995 A 2022.05.13 CN 114490995 A 1.一种多级自注意力的网络安全协同处置作战室语义摘要方法, 其特征在于, 给定一 段网络安全协同处置作战室聊天记录, 该 段聊天记录的语义摘要提取包括以下步骤: S1: 记录网络安全协同处置作战室运营过程形成语料库, 对语料库中的对话、 聊天记录 文本进行建表、 序列化文本内容、 标记出运营人员的角色、 分析问题的内容、 根据分析安排 的应对任务, 构成网络安全协同处置作战室聊天记录语料库; S2: 将语料库中的文本内容通过词向量矩阵转换成标记向量, 通过对不同的句子做0和 1赋值来区分不同的句子得到语句分段向量, 采用变压器为每个标记向量分配位置向量, 拼 接标记向量、 语句分段向量和位置向量形成完整的词向量作为网络结构的输入; S3: 将S2中的输出 结果送入变压器的编码器; S4: 把S3中变压器的编码器输出的结果输入到变压器包含注意力机制的模块中, 将其 压缩为一个向量表 示, 并结合上下文向量, 提取关键信息, 实现对文本中重复冗余内容的排 除; S5: 语料库中的文本内容被压缩为一个向量以后, 通过变压器模型中的解码器生成语 义摘要; S6: 步骤S5 的输出结果经过softmax层处理, 根据权重较大的k个关键词输出文本对应 的语义摘要, 形成任务指令; S7: 利用网络安全协同处置作战室中聊天记录的语义摘要形成任务指令, 简化运营记 录, 生成简洁流畅的摘要任务。 2.根据权利要求1所述的多级自注意力的网络安全协同处置作战室语义摘要方法, 其 特征在于, 所述S2包括 步骤: 对于输入的文本 是由 个句子组成, , 其中 表示文本中的第 句 话, 按顺序对文本进行预处理, 使用LTP分词器进行分词, 再去除噪声词、 停用词, 规范化生 成训练语料, 并为每个句子分配一个标签 , 其中0表示不对句子进行识别, 1表示 对句子进行识别。 3.根据权利要求2所述的多级自注意力的网络安全协同处置作战室语义摘要方法, 其 特征在于, 所述S2还包括步骤: 对处理过的文本经过词向量层由文字符号变成数字序列词 向量, 在首标记[CLS]、 尾标记[S EP], 并且产生对句子进行区别的语句分段向量和表 示每个 词绝对位置的位置向量, 其中标记向量、 语句分段向量、 位置向量的向量 维度均为z, 则输入 序列的对应的标记向量、 语句分段向量、 位置向量的向量的拼接, 用 表示: 其中, 表示句子中每个词的标记向量, 表示语句分段向量, 对应的奇偶数把句子分 成AB块, 表示位置向量, 对应句子的最大长度, 表示输入文本 由三个向量拼接得 到, 在向量空间的行列维度均是 。 4.根据权利要求3所述的多级自注意力的网络安全协同处置作战室语义摘要方法, 其 特征在于, 所述S3包括步骤: 对于输入的文本 是由把输入序列 , 首先传入由多个注意力模 块组成的多头注意力块, 多头的头数是超参, 自定义t个头, 输出就是t个 的向量, 然后权 利 要 求 书 1/3 页 2 CN 114490995 A 2用初始化矩阵 和输入序列 相乘, 得到 , 分别对应查询向量矩阵, 键值向量矩 阵和值向量矩阵。 5.根据权利要求4所述的多级自注意力的网络安全协同处置作战室语义摘要方法, 其 特征在于, 所述S3还包括步骤: 由于是t个注意力头, 即分成 , 为 了当前时刻的注意力权重, 首先计算当前词和 其它词的关联程度, 用查询向量和其他词的 键值向量计算相似度 : 对于计算相似度通过查询向量和键值向量的乘积 进行缩小, 除以同一个系数 , 然 后用softmax函数进行归一 化处理, 得到值 就是当前词与当前词相关的值表示, 表达式为: 用当前词得到的权 重值 来更新当前词的注意力权 重 : 对其它输入序列循环相同步骤, 得到所有输出。 6.根据权利要求5所述的多级自注意力的网络安全协同处置作战室语义摘要方法, 其 特征在于, 所述S3还 包括步骤: 通过以下公式更新注意力权 重: 然后用多头注意力模块将多个注意力权重输出并且拼接在一起, 再和输入序列 做残 差跳跃输出, 再输入进规范层L N输出新的, 其中是输入序列的注意力权 重, 表达式为: 经过计算, 输出的向量作为全连接层的输入, 同样经过残差跳跃和规范层LN, 并且用叠 加线性层封装 且用 函数激活, 表达式为: 全连接层用输出的向量 作为下一层变压器编码部分的输入, 表达式为: 。 7.根据权利要求3所述的多级自注意力的网络安全协同处置作战室语义摘要方法, 其 特征在于, 所述S4包括 步骤:权 利 要 求 书 2/3 页 3 CN 114490995 A 3
专利 多级自注意力的网络安全协同处置作战室语义摘要方法
文档预览
中文文档
14 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-18 17:50:08
上传分享
举报
下载
原文档
(829.4 KB)
分享
友情链接
GB-T 35319-2017 物联网 系统接口要求.pdf
tc260 网络安全标准实践指南 信息系统灾难备份实践指引 2022.pdf
GM-T 0125.1-2022 JSON Web 密码应用语法规范 第1部分:算法标识.pdf
专利 SOAR剧本模型、剧本构建方法、电子设备和存储介质.PDF
重点网络安全:“3保1评”(分保、等保、关保、密评).pdf
TC260-003 生成式人工智能服务安全基本要求.pdf
DB11-T 1190.1-2015 古建筑结构安全性鉴定技术规范 第1部分:木结构 北京市.pdf
DB43-T 1956-2020 十字花科蔬菜黑斑病综合防治技术规程 湖南省.pdf
GM-T 0026-2023 安全认证网关产品规范.pdf
T-GHDQ 88.2—2022 车辆无线通信信息安全测试规范 第2部分:车载WLAN安全测试规范.pdf
T-ZZB 0518—2018 低压电器用抗高温黄变阻燃增强聚酰胺.pdf
T-CIITA 116—2021 PKS体系 数据备份与恢复产品技术要求.pdf
GB-T 41910-2022 洗涤粪菌质量控制和粪菌样本分级.pdf
T-CISA 045—2020 铬—锰—镍—氮系奥氏体不锈钢热轧钢板和钢带.pdf
T-CSBME 064—2022 骨龄辅助诊断人工智能医疗器械质量要求与评价 第1部分:数据集.pdf
绿盟 IoT机顶盒恶意软件应急处置手册.pdf
T-CHIA 14.5—2018 医疗健康物联网 感知设备通信数据命名表 第5部分:血压计.pdf
DB21-T 3297-2020 安全培训过程管理实施指南 辽宁省.pdf
T-CISA 046—2020 铬—锰—镍—氮系奥氏体不锈钢冷轧钢板和钢带.pdf
GB-T 43681-2024 生态系统评估 区域生态系统调查方法.pdf
1
/
3
14
评价文档
赞助1.5元 点击下载(829.4 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。