专利 一种基于双机制差分隐私的联邦学习肺结节检测方法

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210930904.9 (22)申请日 2022.08.04 (71)申请人中国电子技术标准化研究院地址 100007 北京市东城区安定门东大街1 号 (72)发明人范科峰　刘立新　陈海　董建　张士宗　 (74)专利代理机构北京德崇智捷知识产权代理有限公司 1 1467 专利代理师申星宇 (51)Int.Cl. G06T 7/00(2017.01) G06T 7/136(2017.01) G06T 7/155(2017.01) G06T 7/187(2017.01)G06T 7/66(2017.01) G06T 7/73(2017.01) G06T 3/60(2006.01) G06T 3/40(2006.01) G06N 20/00(2019.01) G06N 3/08(2006.01) G06N 3/04(2006.01) (54)发明名称一种基于双机制差分隐私的联邦学习肺结节检测方法 (57)摘要本发明公开了一种基于双机制差分隐私的联邦学习肺结节检测方法，具体步骤为：将肺部 CT图像分割出肺实质；对肺实质进行数据增强，用于训练和测试；构建联邦学习模型；将训练集样本分发给本地客户端；构建肺结节检测模型；初始化本地客户端参数；本地客户端模型训练进行本地权重参数更新，将权重参数进行本地双机制差分隐私加密并上传中央服务器；中央服务器聚合本地客户端权重参数，全局更新后分发给本地客户端；获得肺结节检测结果。本发明通过本地客户端对权重参数差分扰动，上传给中央服务器进行聚合，避免了加密解密的繁琐过程，降低了计算开销，在保证数据隐私和安全的前提下，不损失肺结节检测的精准度。权利要求书2页说明书6页附图1页 CN 115187576 A 2022.10.14 CN 115187576 A 1.一种基于双机制差分隐私的联邦学习肺结节检测方法，其特征在于，包括以下步骤：步骤1、胸部 CT图像预处理：采用阈值分割、图像形态学和图像连通方法获得肺实质图像；将肺实质及肺部组织数据进行归一化处理；步骤2、数据增强：将肺实质图像使用双三次插值进行随机缩放，通过定位肺结节中心点坐标，对不同尺寸的肺结节进行随机剪裁，根据不同结节半径设置不同翻转采样次数，每次采样随机翻转，得到肺结节立方体；步骤3、构建联邦学习模型：构建包括中央服务器和客户端设备集合为S＝{s1,s2,s3…sn}的联邦学习模型，其中n≥ 2；步骤4、向本地客户端分发数据集：在Luna16数据集中，选取一定比例数据作为训练集并打乱，使其符合Non ‑IID分布，平均分发给本地客户端，剩余部分数据作为测试集；步骤5、构建肺结节检测模型：构建一个基于ResNet的双路径肺结节检测模型，采用了H层的3D残差网络作为编码器子网络；步骤6、本地客户端参数初始化：选择每轮参加训练的本地客户端占比为σ，初始化全局聚合迭代次数t，全局聚合T轮，初始化权值参数ω，本地客户端迭代次数为s次，本地客户端训练批大小为B，学习率为 η；步骤7、本地客户端对肺结节检测模型训练： (1)构建本地客户端数据集为Tn＝{t1， t2， t3…tk}，选择部分样本数据作为模型输入； (2)根据数据集之间的平均成对距离来量化内容多样性，确定本地客户端样本数据Tn的内容多样性为 (3)假设成对的距离满足一定的分布，则采样少量的成对距离，使用哈希函数H＝{h1， h2， h3…hk}将每个客户端的数据映射到单独的存储桶； (4)在每个存储桶中随机抽取一定比例M个数据，得到一个采样集γ；其平均成对距离V γ近似于 (5)获取本地客户端损失函数Loss，其为结节的分类损失Lcl和候选结节坐标(x， y， z)与结节尺寸d的回归损失Lreg之和，公式为Loss＝Lcl+Lreg；其中， Lcl为BEC损失函数， Lreg为 Smooth L1损失函数； (6)利用随机梯度下降法更新权值参数，权值参数使用双机制差分隐私加密并上传给中央服务器；步骤8、中央服务器聚合权值参数： (1)中央服务器接收本地模型参数，使用加权平均算法聚合权值参数； (2)中央服务器将聚合后模型参数发送给本地客户端； (3)判断t＜T是否成立，若是t＝t+1，继续训练模型；否则，模型训练完成，获得训练好的双机制差分隐私的联邦学习肺结节检测模型；权　利　要　求　书 1/2 页 2 CN 115187576 A 2步骤9、获得肺结节检测结果：将测试样本输入到训练好的双机制差分隐私的联邦学习肺结节检测模型中，得到所有测试样本的预测标签。 2.根据权利要求1所述的基于双机制差分隐私的联邦学习肺结节检测方法，其特征在于，步骤1中，归一化公式为：其中x为样本的数据值， xmax为肺实质及肺部组织数据的最大值， xmin为肺实质及肺部组织数据的最小值。 3.根据权利要求1所述的基于双机制差分隐私的联邦学习肺结节检测方法，其特征在于，步骤5中，基于ResNet的双路径肺结节检测模型，构建一个基于3D ResNet18双路径网络，采用18层的3D残差网络作为编码器子网络。 4.根据权利要求1所述的基于双机制差分隐私的联邦学习肺结节检测方法，其特征在于，步骤 7 中，采样集保持 γ ≤ Tn，根据霍夫丁不等式，当θ＞ 0 时， 5.根据权利要求1所述的基于双机制差分隐私的联邦学习肺结节检测方法，其特征在于，步骤7中，设权值参数空间为R，分别选择占比20％两个子空间m和n， m∈R， n∈R， m ∪ n ∈ R ；子空间 m 使用差分隐私拉普拉斯机制扰动，公式为子空间n使用差分隐私高斯机制扰动，公式为F(x)＝f(x)+N ( σ2)，其中权　利　要　求　书 2/2 页 3 CN 115187576 A 3

专利 一种基于双机制差分隐私的联邦学习肺结节检测方法

专利一种基于双机制差分隐私的联邦学习肺结节检测方法