说明:收录全文最新的团体标准 提供单次或批量下载
文库搜索
切换导航
文件分类
频道
仅15元无限下载
联系我们
问题反馈
文件分类
仅15元无限下载
联系我们
问题反馈
批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202111610807.3 (22)申请日 2021.12.27 (71)申请人 河北师范大学 地址 050024 河北省石家庄市南 二环东路 20号 (72)发明人 赵冬梅 吴亚星 孙明伟 吴亚亮 于瑞涛 梁丽娜 (74)专利代理 机构 北京方圆嘉 禾知识产权代理 有限公司 1 1385 专利代理师 王月松 (51)Int.Cl. G06Q 10/04(2012.01) G06N 3/04(2006.01) G06N 3/08(2006.01) G06K 9/62(2022.01) (54)发明名称 一种基于机器学习算法的网络安全态势预 测方法及系统 (57)摘要 本发明涉及一种基于机器学习算法的网络 安全态势预测方法及系统。 所述方法包括: 基于 随机森林对网络安全态势数据集中的样本特征 进行特征选择和预处理, 生成筛选后数据集; 计 算筛选后数据集中每条网络流量样本的真实态 势值; 根据滑动窗口大小对态势值数据集进行划 分, 得到训练集和测试集样本; 采用遗传算法对 网络安全态势预测模型隐含层神经单元个数进 行优化, 生成具有最优参数的网络安全态势预测 模型; 采用训练集和测试集样 本对网络安全态势 预测模型进行训练和测试, 生 成训练好的网络安 全态势预测模 型以进行网络安全态势预测。 本发 明方法构建了收敛速度更快且模型简易的网络 安全态势预测模 型, 能够提高网络安全态势预测 的速度、 准确率和真实性。 权利要求书4页 说明书11页 附图2页 CN 114511131 A 2022.05.17 CN 114511131 A 1.一种基于 机器学习算法的网络安全态 势预测方法, 其特 征在于, 包括: 获取网络安全态势数据集; 所述网络安全态势数据集中包括多条网络流量样本, 每条 所述网络流 量样本具有 多个特征; 基于随机森林对所述网络安全态势数据集中的样本特征进行特征选择和预处理, 生成 筛选后数据集; 计算所述筛 选后数据集中每条网络流 量样本的真实态 势值, 生成态 势值数据集; 根据滑动窗口大小对所述态 势值数据集进行划分, 划分出训练集样本和 测试集样本; 基于长短期记 忆网络构建网络安全态 势预测模型; 采用遗传算法对所述网络安全态势预测模型的隐含层神经单元个数进行优化, 生成具 有最优参数的网络安全态 势预测模型; 采用所述训练集样本和测试集样本对所述具有最优参数的网络安全态势预测模型进 行训练和 测试, 生成训练好的网络安全态 势预测模型; 采用所述训练好的网络安全态 势预测模型进行网络安全态 势预测。 2.根据权利要求1所述的方法, 其特征在于, 所述基于随机森林对所述网络安全态势数 据集中的样本特 征进行特征选择, 生成筛 选后数据集, 具体包括: 基于基尼 指数或基于袋外数据, 计算所述网络安全态势数据集中的每个特征的重要性 评分; 根据所述每个特征的重要性评分的大小去除所述网络安全态势数据集中不重要的特 征, 生成所述特 征选择后数据集; 对所述特 征选择后数据集进行 预处理, 生成所述筛 选后数据集。 3.根据权利要求2所述的方法, 其特征在于, 所述基于基尼 指数计算所述网络安全态势 数据集中的每 个特征的重要性评分, 具体包括: 构建具有n颗决策树的随机森林模型; 采用公式 计算决策树中节点m的基尼指数Ginim; 其中pmk表示节 点m中类别k的比例, K表示类别总数; 根据所述基尼指数Ginim, 采用公式 计算特征Xj在决 策树中节点m的重要性 其中Ginil和Ginir分别表示分枝后两个新节点的基尼指 数; 根据所述重要性 采用公式 计算特征Xj在第i颗决策 树的重要性 其中M表示第i颗决策树中的节点 集合; 根据所述重要性 采用公式 计算特征Xj的重要性权 利 要 求 书 1/4 页 2 CN 114511131 A 2采用公式 对特征Xj的重要性 进行归一化处理, 得到特征 Xj的重要性评分FISj; 其中d为特 征总数量。 4.根据权利要求2所述的方法, 其特征在于, 所述基于袋外数据计算所述网络安全态势 数据集中的每 个特征的重要性评分, 具体包括: 构建具有n颗决策树的随机森林模型; 基于所述随机森林模型, 采用公式 计算所述 网络安 全态势数据集中的特征Xj的重要性评分FISj; 其中其中err1OOB表示随机森林的袋外数据误 差; 表示对特 征Xj加入噪声干扰后计算的袋外数据误差 。 5.根据权利要求1所述的方法, 其特征在于, 所述计算所述筛选后数据集中每条网络流 量样本的真实态 势值, 生成态 势值数据集, 具体包括: 采用公式 计算所述筛选后数据集中每条网络流量样本的真实态势值SA (t); 多条所述网络流量样本的真实态势值共同构成所述态势值数据集; 其中Ti表示第i条 攻击样本的攻击威胁因子; C表示时间段t内的攻击样本数量。 6.一种基于 机器学习算法的网络安全态 势预测系统, 其特 征在于, 包括: 网络安全态势数据集获取模块, 用于获取网络安全态势数据集; 所述网络安全态势数 据集中包括多条网络流 量样本, 每条 所述网络流 量样本具有 多个特征; 特征选择和预处理模块, 用于基于随机森林对所述网络安全态势数据集中的样本特征 进行特征选择和预处 理, 生成筛 选后数据集; 真实态势值计算模块, 用于计算所述筛选后数据集中每条网络流量样本的真实态势 值, 生成态 势值数据集; 数据集划分模块, 用于根据滑动 窗口大小对所述态势值数据集进行划分, 划分出训练 集样本和 测试集样本; 网络安全态势预测模型构建模块, 用于基于长短期记忆网络构建网络安全态势预测模 型; 模型参数优化模块, 用于采用遗传算法对所述网络安全态势预测模型的隐含层神经单 元个数进行优化, 生成具有最优参数的网络安全态 势预测模型; 模型训练测试模块, 用于采用所述训练集样本和测试集样本对所述具有最优参数的网 络安全态 势预测模型进行训练和 测试, 生成训练好的网络安全态 势预测模型; 网络安全态势预测模块, 用于采用所述训练好的网络安全态势预测模型进行网络安全 态势预测。 7.根据权利要求6所述的系统, 其特 征在于, 所述特 征选择和预处 理模块具体包括: 重要性评分计算子模块, 用于基于基尼指数或基于袋外数据, 计算所述网络安全态势权 利 要 求 书 2/4 页 3 CN 114511131 A 3
专利 一种基于机器学习算法的网络安全态势预测方法及系统
文档预览
中文文档
18 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
赞助1.5元下载(无需注册)
温馨提示:本文档共18页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助1.5元下载
本文档由 人生无常 于
2024-03-19 03:08:19
上传分享
举报
下载
原文档
(1018.7 KB)
分享
友情链接
GB-T 32789-2016 轮胎噪声测试方法 转鼓法.pdf
GA-T 1788.4-2021 公安视频图像信息系统安全技术要求 第4部分:安全管理平台.pdf
T-GDCKCJH 059—2022 汽车域控制器(DCU)自动化测试线接口规范.pdf
GB-T 39772.2-2021 北斗地基增强系统基准站建设和验收技术规范 第2部分:验收规范.pdf
T-ZBLM 0001—2022 数据中心容灾备份能力建设评价规范.pdf
GB-T 32747-2016 岩土工程仪器安全要求.pdf
GB-T 34618-2017 蒸汽疏水系统在线阀门内漏温度检测方法.pdf
ISO 11551 2019 Optics and photonics — Lasers and laser-related equipment — Test method for absorptance of optical laser components.pdf
GB-T 38626-2020 信息安全技术 智能联网设备口令保护指南.pdf
GB-T 37319-2019 电梯节能逆变电源装置.pdf
YD-T 3951-2021 物联网卡安全监测与管理平台数据采集接口规范.pdf
GB-T 28920-2012 教学实验用危险固体、液体的使用与保管.pdf
GB-T 15852.1-2020 信息技术 安全技术 消息鉴别码 第1部分:采用分组密码的机制.pdf
GB/T 36621-2018 智慧城市 信息技术运营指南.pdf
T-CSRME 005—2020 露天矿山边坡岩体结构面抗剪强度获取技术规程.pdf
T-DFLX 013—2023 梅花鹿茸冻干技术规范.pdf
T-CESA 1143—2021 电子凭据 版式文档格式.pdf
GB-T 39637-2020 金属和合金的腐蚀 土壤环境腐蚀性分类.pdf
中国软件测评中心 数据安全复合治理与实践白皮书.pdf
JCT 2743-2022 平板玻璃生产企业节能技术指南.pdf
1
/
3
18
评价文档
赞助1.5元 点击下载(1018.7 KB)
回到顶部
×
微信扫码支付
1.5
元 自动下载
官方客服微信:siduwenku
支付 完成后 如未跳转 点击这里 下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。