(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210930904.9
(22)申请日 2022.08.04
(71)申请人 中国电子技 术标准化研究院
地址 100007 北京市东城区安定门东大街1
号
(72)发明人 范科峰 刘立新 陈海 董建
张士宗
(74)专利代理 机构 北京德崇智捷知识产权代理
有限公司 1 1467
专利代理师 申星宇
(51)Int.Cl.
G06T 7/00(2017.01)
G06T 7/136(2017.01)
G06T 7/155(2017.01)
G06T 7/187(2017.01)G06T 7/66(2017.01)
G06T 7/73(2017.01)
G06T 3/60(2006.01)
G06T 3/40(2006.01)
G06N 20/00(2019.01)
G06N 3/08(2006.01)
G06N 3/04(2006.01)
(54)发明名称
一种基于双机制差分隐私的联邦学习肺结
节检测方法
(57)摘要
本发明公开了一种基于双机制差分隐私的
联邦学习肺结节检测方法, 具体步骤为: 将肺部
CT图像分割出肺实质; 对肺实质进行数据增强,
用于训练和测试; 构建联邦学习模型; 将训练集
样本分发给本地客户端; 构建肺结节检测模型;
初始化本地客户端参数; 本地客户端模型训练进
行本地权重参数更新, 将权重参数进行本地双机
制差分隐私加密并上传中央服务器; 中央服务器
聚合本地客户端权重参数, 全局更新后分发给本
地客户端; 获得肺结节检测结果。 本发明通过本
地客户端对权重参数差分扰动, 上传给中央服务
器进行聚合, 避免了加密解密的繁琐过程, 降低
了计算开销, 在保证数据隐私和安全的前提下,
不损失肺结节检测的精准度。
权利要求书2页 说明书6页 附图1页
CN 115187576 A
2022.10.14
CN 115187576 A
1.一种基于双机制差分隐私的联邦学习肺结节检测方法, 其特 征在于, 包括以下步骤:
步骤1、 胸部 CT图像预处 理:
采用阈值分割、 图像形态学和图像连通方法获得肺实质图像; 将肺实质及肺部组织数
据进行归一 化处理;
步骤2、 数据增强:
将肺实质图像使用 双三次插值进行随机缩放, 通过定位肺结节中心点坐标, 对不同尺
寸的肺结节进 行随机剪裁, 根据不同结节半径设置不同翻转采样次数, 每次采样随机翻转,
得到肺结节立方体;
步骤3、 构建联邦学习模型:
构建包括中央服务器和客户端设备集合为S={s1,s2,s3…sn}的联邦学习模型, 其中n≥
2;
步骤4、 向本地 客户端分发数据集:
在Luna16数据集中, 选取一定比例数据作为训练集并打乱, 使其符合Non ‑IID分布, 平
均分发给本地 客户端, 剩余部分数据作为测试集;
步骤5、 构建肺结节检测模型:
构建一个基于ResNet的双路径肺结节检测模型, 采用了H层的3D残差网络作为编码器
子网络;
步骤6、 本地 客户端参数初始化:
选择每轮参加训练的本地客户端占比为σ, 初始化全局聚合迭代次数t, 全局聚合T轮,
初始化权值 参数ω, 本地 客户端迭代次数为s次, 本地 客户端训练批大小为B, 学习率 为 η;
步骤7、 本地 客户端对肺结节检测模型训练:
(1)构建本地 客户端数据集 为Tn={t1, t2, t3…tk}, 选择部分样本数据作为模型输入;
(2)根据数据集之间的平均成对距离来量化内容多样性, 确定本地客户端样本 数据Tn的
内容多样性 为
(3)假设成对的距离满足一定的分布, 则采样少量的成对距离, 使用哈希函数H={h1,
h2, h3…hk}将每个客户端的数据映射到单独的存 储桶;
(4)在每个存储桶中随机抽取一定比例M个数据, 得到一个采样集γ; 其平均成对距离V
γ近似于
(5)获取本地客户端损失函数Loss, 其为结节的分类损失Lcl和候选结节坐标(x, y, z)与
结节尺寸d的回归损失Lreg之和, 公式为Loss=Lcl+Lreg; 其中, Lcl为BEC损失函数, Lreg为
Smooth L1损失函数;
(6)利用随机梯度下降法更新权值参数, 权值参数使用双机制差分隐私加密并上传给
中央服务器;
步骤8、 中央服 务器聚合权值 参数:
(1)中央服 务器接收本地模型参数, 使用加权平均算法聚合权值 参数;
(2)中央服 务器将聚合后模型参数发送给本地 客户端;
(3)判断t<T是否成立, 若是t=t+1, 继续训练模型; 否则, 模型训练完成, 获得训练好
的双机制差分隐私的联邦学习肺结节检测模型;权 利 要 求 书 1/2 页
2
CN 115187576 A
2步骤9、 获得肺结节检测结果:
将测试样本输入到训练好的双机制差分隐私的联邦学习肺结节检测模型中, 得到所有
测试样本的预测标签。
2.根据权利要求1所述的基于双机制差分隐私的联邦学习肺结节检测方法, 其特征在
于, 步骤1中, 归一化公式为:
其中x为样本的数据值, xmax为肺实质及肺部组织数据
的最大值, xmin为肺实质及肺部组织数据的最小值。
3.根据权利要求1所述的基于双机制差分隐私的联邦学习肺结节检测方法, 其特征在
于, 步骤5中, 基于ResNet的双路径肺结节检测模型, 构建一个基于3D ResNet18双路径网
络, 采用18层的3D残差网络作为编码器子网络 。
4.根据权利要求1所述的基于双机制差分隐私的联邦学习肺结节检测方法, 其特征在
于 ,步 骤 7 中 ,采 样 集 保 持 γ ≤ Tn,根 据 霍 夫 丁 不 等 式 ,当θ> 0 时 ,
5.根据权利要求1所述的基于双机制差分隐私的联邦学习肺结节检测方法, 其特征在
于, 步骤7中, 设权值参数空间为R, 分别选择占比20%两个子空间m和n, m∈R, n∈R,
m ∪ n ∈ R ; 子 空 间 m 使 用 差 分 隐 私 拉 普 拉 斯 机 制 扰 动 , 公 式 为
子空间n使用差分隐私高斯机制扰动, 公式为F(x)=f(x)+N
( σ2), 其中
权 利 要 求 书 2/2 页
3
CN 115187576 A
3
专利 一种基于双机制差分隐私的联邦学习肺结节检测方法
文档预览
中文文档
10 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 12:01:18上传分享