专利一种网络安全应急响应知识图谱实体对齐方法

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210184898.7 (22)申请日 2022.02.28 (65)同一申请的已公布的文献号申请公布号 CN 114254131 A (43)申请公布日 2022.03.29 (73)专利权人南京众智维信息科技有限公司地址 211300 江苏省南京市高淳区龙井路3 号 (72)发明人车洵　孙捷　梁小川　胡牧　金奎　徐达　刘志顺　 (74)专利代理机构南京知识律师事务所 32 207 专利代理师张苏沛 (51)Int.Cl. G06F 16/36(2019.01) G06F 40/189(2020.01)G06F 40/216(2020.01) G06K 9/62(2022.01) G06N 5/04(2006.01) G06N 3/04(2006.01) 审查员赵阳 (54)发明名称一种网络安全应急响应知识图谱实体对齐方法 (57)摘要本发明公开了一种网络安全应急响应知识图谱实体对齐方法，包括：将知识图谱输入到基于PARIS模型的PR模块进行计算，输出安全事件实体映射集及其相对应的等价概率；在得到的安全事件实体映射集中选择与之相对应的等价概率高的安全事件实体映射作为对齐种子，输入基于嵌入的MultiKE模型的SE模块进行训练；输出安全事件实体嵌入以及通过邻近检索算法得到的安全事件实体映射集及其相对应的每个映射的相似度得分；将获得的作为输入进行下一轮计算；经过K次迭代， PR模块输出安全事件实体映射集；本方案能将多个不同的网络安全应急响应知识图谱融合成一个知识更全面，正确性更高的知识图谱过程中。权利要求书5页说明书14页附图2页 CN 114254131 B 2022.06.07 CN 114254131 B 1.一种网络安全应急响应知识图谱实体对齐方法，其特征在于，包括以下步骤： S1：将知识图谱输入到基于PA RIS模型的PR模块进行计算，输出安全事件实体映射集及其相对应的等价概率； S2：在S1得到的安全事件实体映射集中选择与之相对应的等价概率高的安全事件实体映射作为对齐种子，输入基于嵌入的MultiKE模型的SE模块进行训练； S3：训练完成后， SE模块在尚未被PR模块对齐的安全事件实体集上进行测试，输出安全事件实体嵌入以及通过邻近检索算法得到的安全事件实体映射集及其相对应的每个映射的相似度得分； S4：将S3获得的安全事件实体映射集和安全事件实体嵌入作为输入反馈给PR模块进行下一轮计算； S5：经过K次迭代， PR模块输出最终的安全事件实体映射集；步骤S1：将知识图谱输入到基于PA RIS模型的PR模块进行计算，输出安全事件实体映射集及其相对应的等价概率包括以下步骤： S101：将两个网络安全知识图谱G和G ’输入； S102：在PR模块进行初始化， k＝0时，将知识图谱的关系三元组以函数的形式表达， PR 模块计算每个关系函数作为函数的严谨性，其公式为: 其中F(r)表示将关系r作为函数，即头实体指向唯一尾实体的严谨性的计算， F‑1(r)表示将r的逆关系作为函数，即尾实体指向唯一头实体的严谨性的计算， |{(h， t)|(h， r， t)∈T +}|表示关系三元组与属性三元组的集合中具有r关系的实体对个数， |{h|(h， r， t)∈T+}|表示集合中具有r关系的头实体个数， |{t|(h， r， t)∈T+}|表示集合中具有r关系的尾实体个数； S103： PR模块交替计算知识图谱中安全事件实体等价概率和关系之间的包容关系概率，两个实体h和h ’之间等价的概率记为P(h≡h ′)，由以下公式进行计算： S104： r是r ’的一个子关系的概率记为并初始化为0.1，其计算公式为： S105： PR模块通过自迭代进行优化直至收敛； S106：生成由PR模块得到的安全事件实体映射集合和未对齐的安全事件实体集步骤S2：在S1得到的安全事件实体映射集中选择与之相对应的等价概率高的安全事件实体映射作为对齐种子，输入基于嵌入的MultiKE模型的SE模块进行训练包括以下步骤： S201：进行 K次循环迭代；权　利　要　求　书 1/5 页 2 CN 114254131 B 2S202：在第一次迭代中， k＝1，通过设置阈值δ2，从上一次迭代中PR模块输出的安全事件实体映射集合选出该集合中实体等价概率的映射作为对齐种子，记为Sk，其中δ2∈[0， 1)； S203：将对齐种子Sk作为SE模块的输入进行训练； S204：使用TransE模型，通过收敛以下的损失函数来学习对齐种子中实体与关系之间的向量表示，其损失函数的公式为：其中||·||表示欧几里德范数运算,中间的h,r,t分别表示h,r,t的m维嵌入； S205：用以下分数函数来测量关系事实h,r,t的关系嵌入的合理性: frel(h， r， t)＝| |h+r‑t|| 其中frel(·)表示在关系视图下测量关系事实h,r,t嵌入的合理性的分数函数； S206：计算对齐种子中关系事实h,r,t真实存在的概率，公式为： Prel( ζ(h， r， t)＝1|Θ(1))＝sigmid(frel(h， r， t)) 其中Θ(1)指关系视图中的嵌入， ζ(h， r， t)＝1表示(h,r,t)真实存在的标签； S207：通过收敛以下的损失函数来学习关系视图中的嵌入Θ(1)：其中χ+为对齐种子中的真实关系事实集，而x‑表示通过将真实关系的头实体或者尾实体替换为随机实体后进行采样的伪造事实集， Θ(1)指关系视图中的嵌入，表示关系视图的逻辑损失函数， frel(·）表示在关系视图下测量关系事实h,r,t嵌入的合理性的分数函数， ζ(h， r， t)表示(h,r,t)的标签； S208：将属性嵌入及对应的属性值拼接成矩阵，送至卷积核为2xc的CNN进行计算，以得到其压缩表示，并将得到的特征张量重塑为一个向量形式送入参数为W的全连接层，该过程用以下公式表示： CNN(<a； v>)＝σ(vec( σ(<a;v>*Ω) )) 其中CNN( ·)表示卷积操作以得到属性嵌入及对应的属性值拼接成的矩阵的压缩表示， <a； v>即为属性嵌入a与其对应的属性值拼接而成的矩阵， v ec(·)将特征映射张量重塑为向量， Ω是一个2xc的卷积核， σ( ·)是一个激活函数； S209：用以下分数函数来测量属性事实h,a,v的嵌入合理性: fattr(h， r， t(=)＝ ‑||h‑CNN(<a； v>)| | 其中fattr(·)表示在属性视图下测量属性事实h,a,v嵌入的合理性的分数函数； S210：通过收敛以下的损失函数来学习属性视图中的嵌入Θ(2)：其中Θ(2)指属性视图中的嵌入，表示属性视图的逻辑损失函数， fattr(·)表示权　利　要　求　书 2/5 页 3 CN 114254131 B 3

专利 一种网络安全应急响应知识图谱实体对齐方法

专利一种网络安全应急响应知识图谱实体对齐方法