说明:收录全文最新的团体标准 提供单次或批量下载
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211012282.8 (22)申请日 2022.08.23 (71)申请人 中国电子科技网络信息安全 有限公 司 地址 610207 四川省成 都市双流区西南 航 空港经济开发区工业 集中区内 (72)发明人 韩烨 孙治 毛得明 陈剑锋  王一凡 何秉钧  (74)专利代理 机构 成都九鼎天元知识产权代理 有限公司 51214 专利代理师 管高峰 (51)Int.Cl. G06F 21/56(2013.01) G06K 9/62(2022.01) G06N 20/00(2019.01) (54)发明名称 一种深度学习对抗样本安全性评价方法 (57)摘要 本发明公开了一种深度学习对抗样本安全 性评价方法, 包括以下步骤: S1.利用不同对抗样 本生成策略生成不同的对抗样本集; S2.依次利 用生成的各对抗样本集对待测深度学习模型进 行攻击, 分别计算攻击有效性评价指标; S3.为待 测深度学习模 型装备对抗样本防御方法, 计算防 御有效性评价指标, 构建隶属度评价矩阵; S4.对 隶属度评价矩阵中的元素进行标准化处理; S5. 计算第j个防御有效性评价指标下第i个对抗样 本集的贡献度; S6.计算第j个防御有效性评价指 标的信息熵和测试结果一致性程度; S7.计算第j 个防御有效性评价指标的权重: S8.计算对抗样 本安全性 综合评分。 本发明能够对深处学习模型 的对抗样本安全性进行全面 客观的评价。 权利要求书5页 说明书12页 附图3页 CN 115438337 A 2022.12.06 CN 115438337 A 1.一种深度学习对抗样本安全性评价方法, 其特 征在于, 包括以下步骤: S1.利用不同对抗样本生成策略生成不同的对抗样本集; S2.依次利用生成的各对抗样本集对待测深度学习模型进行攻击, 分别计算攻击有效 性评价指标; S3.为待测深度学习模型装备对抗样本防御方法, 计算防御有效性评价指标, 生成n个 对抗样本集对应于m个防御有效性评价指标的数值构成隶属度评价矩阵R=(rij)n×m, 其中 rij为第i个对抗样本集对应的第j个防御有效性评价指标的数值; S4.对隶属度评价矩阵R中的元素进行标准化处理, 将矩阵中的每个元素除以其所在列 的元素的最大值; S5.计算第j个防御有效性评价指标 下第i个对抗样本集的贡献度Pij: S6.计算第j个防御有效性评价指标的信息熵Ej: 并计算第j个防御有效性评价指标 下各对抗样本集测试 结果的一 致性程度dj=1‑Ej; S7.计算第j个防御有效性评价指标的权 重wj: S8.根据步骤S7中计算得到的防御有效性评价指标权重以及步骤S3中计算得到的防御 有效性评价指标数值, 计算装备了防御方法的待测深度学习模型对抗样本安全性综合评 分。 2.根据权利要求1所述的深度 学习对抗样本安全性评价方法, 其特征在于, 所述攻击有 效性评价指标包括模型性能下降程度指标与对抗样本自身易识别性指标, 所述模型性能下 降程度指标用于描述模型在 对抗样本集上的性能指标较在原测试集上的下降程度, 所述对 抗样本自身易识别性指标用于描述对抗样本自身是否容 易被识别。 3.根据权利要求2所述的深度 学习对抗样本安全性评价方法, 其特征在于, 所述模型性 能下降程度指标包括分类与回归两个子类别, 分别针对分类与回归两类深度学习模型, 针 对分类模型 的模型性能下降程度指标包括对抗类平均置信度、 真实类平均置信度、 错分率 和平均对抗损失, 针对回归模型 的模型性能下降程度指标包括对抗预测平均绝对误差、 对 抗预测均方误差和平均对抗损失。 4.根据权利要求3所述的深度 学习对抗样本安全性评价方法, 其特征在于, 对抗类平均 置信度的计算式为:权 利 要 求 书 1/5 页 2 CN 115438337 A 2式中n表示成功欺骗深度学习模型的对抗样本数, 表示对抗样本集中的第i个成功欺 骗深度学习模型的对抗样本, 表示模型对该样本类别的预测结果, 表示模 型对分类结果的置信度; 真实类平均置信度的计算式为: 式中n表示成功欺骗深度学习模型的对抗样本数, 表示对抗样本集中的第i个成功欺 骗深度学习模型的对抗样本, yi表示该样本的真实类别标签, 表示模型对对抗样本 类别标签为yi的置信度; 错分率的计算式为: 式中MRUA针对无目标对抗样本攻击, 对抗样本只需使深度学习模型输出错误的预测 结 果, MRTA针对有目标对抗样本 攻击, 对抗样本使深度学习模型将其识别为 特定类别; N表示对 抗样本集中对抗样本 的数量, 表示对抗样本集中的第i个对抗样本, yi表示该样本 的真 实类别标签, 表示有目标对抗样 本攻击中对抗样本诱导深度学习模 型输出的特定错误类 别; 对抗预测平均绝对误差的计算式为: 式中N表示对抗样本集中对抗样本的数量, 表示对抗样本集中的第i个对抗样本, 表示模型对该样本 输出的预测结果, yi表示该样本对应的真实输出; 对抗预测均方误差的计算式为: 式中N表示对抗样本集中对抗样本的数量, 表示对抗样本集中的第i个对抗样本, 表示模型对该样本 输出的预测结果, yi表示该样本对应的真实输出; 平均对抗损失的计算式为: 权 利 要 求 书 2/5 页 3 CN 115438337 A 3

.PDF文档 专利 一种深度学习对抗样本安全性评价方法

文档预览
中文文档 21 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共21页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种深度学习对抗样本安全性评价方法 第 1 页 专利 一种深度学习对抗样本安全性评价方法 第 2 页 专利 一种深度学习对抗样本安全性评价方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 13:02:23上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。