(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210647637.4
(22)申请日 2022.06.08
(71)申请人 阿里云计算有限公司
地址 310024 浙江省杭州市西湖区转塘科
技经济区块12号
(72)发明人 袁小栋
(74)专利代理 机构 北京博思佳知识产权代理有
限公司 1 1415
专利代理师 李威
(51)Int.Cl.
G06F 21/56(2013.01)
G06F 16/2455(2019.01)
G06F 16/901(2019.01)
G06F 16/903(2019.01)
G06F 16/9035(2019.01)
(54)发明名称
一种数据安全检测方法及装置
(57)摘要
本说明书提供了一种数据安全检测方法及
装置, 应用于云服务系统搭载的用于运行预设的
检测规则, 对待检测数据进行安全检测的大数据
计算引擎。 检测规则包括若干正则表达式。 所述
方法包括: 根据正则表达式对应的数据字段, 对
检测规则包含的正则表达式进行分组, 得到多个
正则表达式集合。 正则表达式集合中的各个正则
表达式对应的数据字段相同。 响应于接收到的待
检测数据, 执行多个正则表达式集合中的正则表
达式, 并将执行结果缓存至缓存空间中; 响应于
所有正则表达式执行完毕, 依次从检测规则库中
读取检测规则, 从缓存空间中读取该检测规则包
含的各个正则表达式的执行结果, 生成与该检测
规则对应的检测结果。
权利要求书3页 说明书14页 附图4页
CN 115168850 A
2022.10.11
CN 115168850 A
1.一种数据安全检测方法, 应用于云服务系统搭载的大数据计算引擎, 所述计算引擎
用于运行预设的检测规则库中的检测规则, 对来自与所述云服务系统对接的数据源的待检
测数据进行安全检测; 其中所述待检测数据包括若干个数据字段; 所述检测 规则包括复数
个与待检测数据中包含的数据字段对应的正则表达式; 所述正则表达式用于针对所述待检
测数据中包 含的与该正则表达式对应的数据字段进行正则匹配; 所述方法包括:
根据正则表达 式对应的数据字段, 对所述检测规则库中的检测规则包含的正则表达式
进行分组, 得到 分别对应不同的数据字段的多个正则表达式集合; 其中, 所述正则表达式集
合中的各个正则表达式对应的数据字段相同;
响应于接收到来自所述数据源的待检测数据, 执行所述多个正则表达式集合中的正则
表达式, 并将各个正则表达式集 合对应的执 行结果缓存至缓存空间中;
响应于所述待检测数据包含的所有数据字段对应的正则表达式集合中的正则表达式
均执行完毕, 依 次从所述检测规则库中读取待执行 的检测规则, 从所述缓存空间中读取该
检测规则包含的各个正则表达式的执行结果, 并基于读取到的执行结果生成与该检测规则
对应的检测结果。
2.根据权利要求1所述的方法,
所述检测规则包括由复数个与待检测数据中包含的数据字段对应的正则表达式, 按照
预设的逻辑 运算方式构成的逻辑 运算式;
所述基于读取到的执 行结果生成与该检测规则对应的检测结果, 包括:
基于读取到的执行结果, 按照预设的逻辑运算方式进行逻辑运算, 以得到与该检测规
则对应的检测结果。
3.根据权利要求1所述的方法,
所述待检测数据包括在来自同一数据源的流数据中通过滑动 窗口动态截取的数据片
段。
4.根据权利要求1所述的方法,
所述根据正则表达 式对应的数据字段, 对所述检测规则库中的检测规则包含的正则表
达式进行分组之前, 还 包括:
对所述待检测数据进行数据 预处理, 以将所述待检测数据中包含的数据字段处理为规
范字段。
5.根据权利要求1所述的方法,
所述执行所述多个正则表达式集 合中的正则表达式, 包括:
基于预设的正则表达式加速框架, 批量执行所述多个正则表达式集合中的正则表达
式。
6.根据权利要求1所述的方法,
所述将各个正则表达式集 合对应的执 行结果缓存至缓存空间中, 包括:
根据所述各个正则表达 式集合对应的数据字段, 分别以通过对所述数据字段的字段值
进行md5运算得到的md5值作为key值, 以所述正则表达式集合对应的执行结果的值作为
value值, 构成key ‑value键值对, 并将所述键值对 存入缓存空间。
7.根据权利要求6所述的方法,
所述缓存空间包括主缓存空间, 所述主缓存空间包括由若干个主数组元素构 成的主数权 利 要 求 书 1/3 页
2
CN 115168850 A
2组结构;
所述将所述键值对 存入缓存空间, 包括:
为所述键值对分配一个主数组元 素, 将所述键值对 存入所述主数组元 素。
8.根据权利要求7 所述的方法,
所述主数组元 素的数量 为所述数据字段的数量;
所述为所述键值对分配一个主数组元 素, 包括:
对所述键值对的key值做哈希运算, 将与得到的哈希值对应的主数组元素分配给所述
键值对。
9.根据权利要求7 所述的方法,
所述缓存空间包括由若干各附加缓存空间块构成的附加缓存空间;
所述附加缓存空间块包括由若干个附加数组结构 构成的列表结构;
所述附加数组结构由若干个附加数组元 素构成。
10.根据所述权利要求9所述的方法,
所述将所述键值对 存入所述主数组元 素, 包括:
判断所述value值的长度是否超过 预设的阈值;
若否, 将所述键值对 存入所述主数组元 素;
若是, 为所述键值对分配若干个附加数组元素, 将所述键值对中的value值存入所述附
加数组元素, 并将所述键值对中的key值和指向所述附加数组元素 的地址的指针存入所述
主数组元 素。
11.根据权利要求9所述的方法,
所述对所述键值对的key值做哈希运算, 将与得到的哈希值对应的主数组元素分配给
所述键值对, 包括:
对所述键值对的key值做哈希运算, 判断与得到的哈希值对应的主数组元素是否已经
存储了键值对;
若否, 将与所述哈希值对应的主数组元 素分配给 所述键值对;
若是, 为所述键值对分配一个附加数组元素, 并将指向所述附加数组元素的地址的指
针存入所述主数组元 素。
12.一种数据安全检测装置, 应用于云服务系统搭载的大数据计算引擎, 所述计算引擎
用于运行预设的检测规则库中的检测规则, 对来自与所述云服务系统对接的数据源的待检
测数据进行安全检测;
其中所述待检测数据包括若干个数据字段; 所述检测规则包括复数个与待检测数据中
包含的数据字段对应的正则表达式; 所述正则表达式用于针对所述待检测数据中包含的与
该正则表达式对应的数据字段进行正则匹配;
所述装置包括:
分组单元, 用于根据正则表达式对应的数据字段, 对所述检测规则库中的检测规则包
含的正则表达式进 行分组, 得到 分别对应不同的数据字段的多个正则表达式集合; 其中, 所
述正则表达式集 合中的各个正则表达式对应的数据字段相同;
缓存单元, 用于响应于接收到来自所述数据源的待检测数据, 执行所述多个正则表达
式集合中的正则表达式, 并将各个正则表达式集 合对应的执 行结果缓存至缓存空间中;权 利 要 求 书 2/3 页
3
CN 115168850 A
3
专利 一种数据安全检测方法及装置
文档预览
中文文档
22 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共22页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 00:11:09上传分享