(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210366075.6
(22)申请日 2022.04.08
(71)申请人 北京国信网联科技有限公司
地址 100041 北京市石景山区实兴大街3 0
号院17号楼4层67号
(72)发明人 杨莹 赵春健
(74)专利代理 机构 北京翔石知识产权代理事务
所(普通合伙) 11816
专利代理师 刘翔
(51)Int.Cl.
G06F 21/62(2013.01)
G06F 16/25(2019.01)
G06N 20/00(2019.01)
(54)发明名称
一种基于机器学习的数据安全交换系统及
方法
(57)摘要
本发明涉及机器学习技术领域, 尤其涉及一
种基于机器学习的数据安全交换系统, 系统包
括, 内设数据存储模块、 自主学习模块、 数据抓取
模块、 数据判定模块, 数据判定模块用以对请求
录入的数据进行安全判断, 对于判定合格的数据
数据判定模块将请求录入的数据传递至内设数
据存储模块, 自主学习模块对录入的数据进行机
器学习, 学习过程中设置有学习等级, 不同的学
习等级对应不同学习效果。 本发 明通过设置学习
等级确定不同的学习效果, 减小可疑数据的学习
效果的影 响, 增加自主学习的准确性, 同时, 对于
低质量的学习数据设置数据占比, 限定低质量数
据的录入, 减 小低等级数据对自主学习的影响。
权利要求书3页 说明书7页 附图2页
CN 114707181 A
2022.07.05
CN 114707181 A
1.一种基于 机器学习的数据安全交换系统, 其特 征在于, 包括,
内设数据存 储模块, 用以存 储进行机器学习的数据,
自主学习模块, 其与所述内设数据存储模块相连, 用以对存储的数据进行自主机器学
习;
数据抓取模块, 其与外 部数据库相连, 用以获取外 部数据的请求录入信息;
数据判定模块, 其与所述数据抓取模块相连, 用以对请求录入的数据进行安全判断, 对
于判定合格的数据所述数据判定模块将请求录入的数据传递至所述内设数据存储模块, 所
述自主学习模块对录入的数据进行机器学习, 学习过程中设置有学习等级, 不同的学习等
级对应不同学习效果;
安全判断包括 危险数据信息判断, 敏感数据信息判断和解码验证;
在进行数据录入前, 判定数据的学习等级, 并对内设数据存储模块内存储的数据占比
确定是否 录入请求数据。
2.根据权利要求1所述的基于机器学习的数据安全交换系统, 其特征在于, 所述数据判
定模块内设置有危险数据标记信息组A0, 所述危险数据标记信息组A0包括: 第一危险数据
信息A1、 第二 危险数据信息A 2、 ...第n危险数据信息An,n 为正整数;
所述数据抓取模块与外部数据库相连, 当外部数据库存有拟学习数据B0请求录入内设
数据存储模块时, 所述数据抓取模块拟学习 数据B0进行抓取, 并将数据传递至所述数据判
定模块, 所述数据判定模块对拟学习数据B0进行分析, 判断拟学习数据B0是否存有危险数
据信息,
当拟学习数据B0中存有第i危 险数据信息Ai时, 所述数据判定模块判定拟学习数据B0
存在安全风险;
当拟学习数据B0中不存在任何危险数据 标记信息组A0内数据时, 所述数据判定模块对
拟学习数据B0进行二级风险分析。
3.根据权利要求1所述的基于机器学习的数据安全交换系统, 其特征在于, 所述数据判
定模块内设置有敏感标记信息组C0, 所述敏感标记信息组C0包括, 第一敏感标记C1, 第二敏
感标记C2, . ..第m敏感标记Cm, m为 正整数;
所述数据判定模块对拟学习数据B0进行进行二级风险分析, 获取拟学习数据B0的敏感
标记数量e, 数据判定模块根据拟学习数据B0的敏感标记数量e计算拟学习数据B0的危险价
值Zb, Zb=e ×P, 其中, P为拟学习数据危险价 值计算补偿参数;
所述数据判定模块内设置有危险价值评价值Zp, 数据判定模块将危险价值Zb与危险价
值评价值Zp进行对比,
当Zb≤Zp时, 所述数据判定模块判定拟学习数据B0危险价 值低;
当Zb>Zp时, 所述数据判定模块判定拟学习数据B0危险价值高, 拟学习数据B0存在安
全风险。
4.根据权利要求1所述的基于机器学习的数据安全交换系统, 其特征在于, 所述数据判
定模块设置有第一预设敏感标记数量评价参数E1,第二预设敏感标记数量评价参数E2,第
一预设危险价值计算补偿参数P1, 第二预设危险价值计算补偿参数P2, 第三预设危险价值
计算补偿参数P 3, 数据判定模块将敏感标记数量e与第一预设敏感标记数量评价参数E1,第
二预设敏感标记数量评价 参数E2进行对比,权 利 要 求 书 1/3 页
2
CN 114707181 A
2当e≤E1时, 所述数据判定模块将第一预设危 险价值计算补偿参数P1作为拟学习数据
危险价值计算补偿参数P的数值;
当E1<e≤E2时, 所述数据判定模块将第二预设危 险价值计算补偿参数P2作为拟学习
数据危险价 值计算补偿参数P的数值;
当e>E2时, 所述数据判定模块将第三预设危 险价值计算补偿参数P3作为拟学习数据
危险价值计算补偿参数P的数值。
5.根据权利要求4所述的基于机器学习的数据安全交换系统, 其特征在于, 对于任一请
求录入内设数据存储模块的拟学习数据B0, 其自身附带唯一指 定信息编 码G, 所述数据判定
模块内设有解码程序, 所述数据判定模块判定拟学习 数据B0危险价值低时, 数据判定模块
对信息编码G进行解码, 获取拟学习数据B0的请求码gz, 数据判定模块对请求码gz进行验
证;
验证成功, 所述数据判定模块同意拟学习数据B0录入所述内设数据存储模块, 所述自
主学习模块对拟学习数据B0进行机 械学习;
验证失败, 所述数据判定模块拒绝拟学习数据B0 录入所述内设数据存 储模块。
6.根据权利要求5所述的基于机器学习的数据安全交换系统, 其特征在于, 当所述数据
判定模块对请求码gz验证成功时, 所述数据判定模块内根据请求码gz判断拟学习数据B0的
学习等级, 学习 等级包括第一等级S1, 第二等级S2, 第三等级S3, 不同等级确 定不同的学习
效果;
当所述数据判定模块判定拟学习数据B0的学习等级为第一等级S1时, 所述自主学习模
块对拟学习数据B0进行机 械学习时, 学习效果 为1;
当所述数据判定模块判定拟学习数据B0的学习等级为第二等级S2时, 所述自主学习模
块对拟学习数据B0进行机 械学习时, 学习效果 为0.6;
当所述数据判定模块判定拟学习数据B0的学习等级为第三等级S3时, 所述自主学习模
块对拟学习数据B0进行机 械学习时, 学习效果 为0.3。
7.根据权利要求6所述的基于机器学习的数据安全交换系统, 其特征在于, 所述数据判
定模块设置有第二 等级数据量占比评价 值K2和第三 等级数据量占比评价 值K3
当所述数据判定模块判定拟学习数据B0的学习等级为第二等级S2时, 所述数据判定模
块获取内设数据存储模块中第二等级的数据量占比Z2, 并将Z2与第二等级 数据量占比评价
值K2对比,
当Z2≤K2时, 所述数据判定模块同意拟学习数据B0录入所述内设数据存储模块, 所述
自主学习模块对拟学习数据B0进行机 械学习;
当Z2>K2时, 所述数据判定模块判定内设数据存储模块中第二等级的数据量占比过
大, 所述数据判定模块拒绝拟学习数据B0 录入所述内设数据存 储模块。
8.根据权利要求7所述的基于机器学习的数据安全交换系统, 其特征在于, 当所述数据
判定模块判定拟学习数据B0的学习等级为第三等级S 3时, 所述数据判定模块 获取内设数据
存储模块中第三 等级的数据量占比Z3, 并将Z3与第三 等级数据量占比评价 值K3对比,
当Z3≤K3时, 所述数据判定模块同意拟学习数据B0录入所述内设数据存储模块, 所述
自主学习模块对拟学习数据B0进行机 械学习;
当Z3>K3时, 所述数据判定模块判定内设数据存储模块中第三等级的数据量占比过权 利 要 求 书 2/3 页
3
CN 114707181 A
3
专利 一种基于机器学习的数据安全交换系统及方法
文档预览
中文文档
13 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-07 12:39:42上传分享