(19)国家知识产权局
(12)发明 专利
(10)授权公告 号
(45)授权公告日
(21)申请 号 202210184898.7
(22)申请日 2022.02.28
(65)同一申请的已公布的文献号
申请公布号 CN 114254131 A
(43)申请公布日 2022.03.29
(73)专利权人 南京众智维信息科技有限公司
地址 211300 江苏省南京市高淳区龙井路3
号
(72)发明人 车洵 孙捷 梁小川 胡牧 金奎
徐达 刘志顺
(74)专利代理 机构 南京知识律师事务所 32 207
专利代理师 张苏沛
(51)Int.Cl.
G06F 16/36(2019.01)
G06F 40/189(2020.01)G06F 40/216(2020.01)
G06K 9/62(2022.01)
G06N 5/04(2006.01)
G06N 3/04(2006.01)
审查员 赵阳
(54)发明名称
一种网络安全应急响应知识图谱实体对齐
方法
(57)摘要
本发明公开了一种网络安全应急响应知识
图谱实体对齐方法, 包括: 将知识图谱输入到基
于PARIS模型的PR模块进行计算, 输出安全事件
实体映射集及其相对应的等价概率; 在得到的安
全事件实体映射集中选择与之相对应的等价概
率高的安全事件实体映射作为对齐种子, 输入基
于嵌入的MultiKE模型的SE模块进行训练; 输出
安全事件实体嵌入以及通过邻近检索算法得到
的安全事件实体映射集及其相对应的每个映射
的相似度得分; 将获得的作为输入进行下一轮计
算; 经过K次迭代, PR模块输 出安全事件实体映射
集; 本方案能将多个不同的网络安全应急响应知
识图谱融合成一个知识更全面, 正确性更高的知
识图谱过程中。
权利要求书5页 说明书14页 附图2页
CN 114254131 B
2022.06.07
CN 114254131 B
1.一种网络安全应急响应知识图谱实体对齐方法, 其特 征在于, 包括以下步骤:
S1: 将知识图谱输入到基于PA RIS模型的PR模块进行计算, 输出安全事件实体映射集及
其相对应的等 价概率;
S2: 在S1得到的安全事件实体映射集中选择与之相对应的等价概率高的安全事件实体
映射作为对齐种子, 输入基于嵌入的MultiKE模型的SE模块进行训练;
S3: 训练完成后, SE模块在尚未被PR模块对齐的安全事件实体集上进行测试, 输出安全
事件实体嵌入以及通过邻近检索算法得到的安全事件实体映射集及其相对应的每个映射
的相似度得分;
S4: 将S3获得的安全事件实体映射集和安全事件实体嵌入作为输入反馈给PR模块进行
下一轮计算;
S5: 经过K次迭代, PR模块输出最终的安全 事件实体映射 集;
步骤S1: 将知识图谱输入到基于PA RIS模型的PR模块进行计算, 输出安全事件实体映射
集及其相对应的等 价概率包括以下步骤:
S101: 将两个网络安全知识图谱G和G ’输入;
S102: 在PR模块进行初始化, k=0时, 将知识图谱的关系三元组 以函数的形式表达, PR
模块计算每 个关系函数作为 函数的严谨性, 其公式为:
其中F(r)表示将关系r作为函数, 即头实体指向唯一尾实体的严谨性的计算, F‑1(r)表
示将r的逆关系 作为函数, 即尾实体指向唯一头实体的严谨 性的计算, |{(h, t)|(h, r, t)∈T
+}|表示关系三 元组与属性三 元组的集合中具有r关系的实体对个数, |{h|(h, r, t)∈T+}|表
示集合中具有r关系的头实体个数, |{t|(h, r, t)∈T+}|表示集合中具有r关系的尾实体个
数;
S103: PR模块交替计算知识图谱中安全事件实体等价概率和关系之间的包容关系概
率, 两个实体h和h ’之间等价的概率记为P(h≡h ′), 由以下公式进行计算:
S104: r是r ’的一个子关系的概 率记为
并初始化 为0.1, 其计算公式为:
S105: PR模块 通过自迭代进行优化 直至收敛;
S106: 生成由PR模块得到的安全 事件实体映射 集合
和未对齐的安全 事件实体集
步骤S2: 在S1得到的安全事件实体映射集中选择与之相对应的等价概率高的安全事件
实体映射作为对齐种子, 输入基于嵌入的MultiKE模型的SE模块进行训练包括以下步骤:
S201: 进行 K次循环迭代;权 利 要 求 书 1/5 页
2
CN 114254131 B
2S202: 在第一次迭代中, k=1, 通过设置阈值δ2, 从上一次迭代中PR模 块输出的安全事件
实体映射集合
选出该集合中实体等价概率
的映射作为对齐种
子, 记为Sk, 其中δ2∈[0, 1);
S203: 将对齐种子Sk作为SE模块的输入进行训练;
S204: 使用TransE模型, 通过收敛以下的损失函数来学习对齐种子中实体与关系之间
的向量表示, 其损失函数的公式为:
其中||·||表示欧几里德范 数运算,中间的h,r,t分别表示h,r,t的m维嵌入;
S205: 用以下分数函数来测量关系事实h,r,t的关系嵌入的合理性:
frel(h, r, t)=| |h+r‑t||
其中frel(·)表示在关系视图下测量关系事实h,r,t嵌入的合理性的分数函数;
S206: 计算对齐种子中关系事实h,r,t真实存在的概 率, 公式为:
Prel( ζ(h, r, t)=1|Θ(1))=sigmid(frel(h, r, t))
其中Θ(1)指关系视图中的嵌入, ζ(h, r, t)=1表示(h,r,t)真实存在的标签;
S207: 通过收敛以下的损失函数来学习关系视图中的嵌入Θ(1):
其中χ+为对齐种子中的真实关系事实集, 而x‑表示通过将真实关系的头实体或者尾实
体替换为随机实体后进行采样的伪造事实集, Θ(1)指关系视图中的嵌入,
表示关
系视图的逻辑损失函数, frel(·) 表示在关系视图下测量关系事实h,r,t嵌入的合理性的分
数函数, ζ(h, r, t)表示(h,r,t)的标签;
S208: 将属性嵌入及对应的属性值拼接成矩阵, 送至卷积核为2xc的CNN进行计算, 以得
到其压缩表示, 并将得到的特征张量重塑为一个向量形式送入参数为W的全连接层, 该过程
用以下公式表示:
CNN(<a; v>)=σ(vec( σ(<a;v>*Ω) ))
其中CNN( ·)表示卷积操作以得到属性嵌入及对应的属性值拼接成的矩阵的压缩表
示, <a; v>即为属性 嵌入a与其对应的属性值拼接而成的矩阵, v ec(·)将特征映射张量重塑
为向量, Ω是一个2xc的卷积核, σ( ·)是一个激活函数;
S209: 用以下分数函数来测量属性事实h,a,v的嵌入合理性:
fattr(h, r, t(=)= ‑||h‑CNN(<a; v>)| |
其中fattr(·)表示在属性视图下测量属性事实h,a,v嵌入的合理性的分数函数;
S210: 通过收敛以下的损失函数来学习属性视图中的嵌入Θ(2):
其中Θ(2)指属性视图中的嵌入,
表示属性视图的逻辑损失函数, fattr(·)表示权 利 要 求 书 2/5 页
3
CN 114254131 B
3
专利 一种网络安全应急响应知识图谱实体对齐方法
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 08:54:58上传分享