位置: IT常识 - 正文

联邦学习(FL)+差分隐私(DP)

编辑:rootadmin
联邦学习(FL)+差分隐私(DP) 联邦学习(FL)+差分隐私(DP)

推荐整理分享联邦学习(FL)+差分隐私(DP),希望有所帮助,仅作参考,欢迎阅读内容。

文章相关热门搜索词:,内容如对您有帮助,希望把文章链接给更多的朋友!

文章首发在我的博客!在这里在这里在这里在这里在这里!!!!!!

防止梯度信息被泄露的方法有很多,目前主要有两种:

1.基于安全多方计算的

这个里面包含的方法很多,包括对梯度进行安全聚合算法进行聚合,或者进行同态加密运算,等等,文章以及方法很多。

2.基于差分隐私的

差分隐私能被用于抵抗成员推理攻击。这个里面主要就是对梯度信息添加噪音,添加的噪音种类可能不同,但是目前主要就是拉普拉斯噪声和高斯噪声这两种。

基于差分隐私的联邦学习主要是对梯度信息添加噪声,不会有很高的通信或者计算代价,但是由于我们对于梯度进行进行了加噪,所以会影响模型收敛的速度,可能会需要更多的round才能达到我们想要的精度。

差分隐私能抵御成员推理攻击

Differential Privacy for Deep and Federated Learning: A Survey【IEEE ACCESS 2022】

本文贡献:

1.给数据集加噪的隐私保护技术,如k-匿名性、l-多样性和t-贴近度

2.训练前给数据集加噪,训练时给梯度加噪,部署训练完成的模型给模型加噪。

数据集隐私保护技术

k−anonymity(k-匿名)、l−diversity(l-多样性)和t−closeness(t-贴近)

训练过程中的隐私保护技术

1)Secure multi party computing (SMC)安全多方计算

是密码学的一个子领域,它允许创建方法来使用来自不同方的输入联合计算函数,而无需向彼此也不向中央服务器显示这些输入。不需要可信第三方。SMC在计算复杂性和通信开销方面代价高昂。因此,SMC不适合在涉及许多客户的大数据集上训练复杂模型。

2)同态加密

允许在加密数据集上训练模型。他获得了与在数据集的未加密版本(即原始数据集)上执行培训相同的准确性。然而,由于其计算复杂性,在DL中使用HE在实践中效率很低,尤其是当训练数据集太大而无法放入计算机内存时,

差分隐私DP

虽然DP的第一个定义是在2006年,但仅在最近几年才在实际使用中得到重视。

1. Central differential privacy (CDP)中央差分隐私

用户向数据库管理者发送原始数据,信任数据库管理员,将随机噪声添加到原始数据集或原始数据集上启动的查询的结果中。数据管理员在响应第三方的统计查询进行分析之前,使用DP扰动原始数据集。

2. Local differential privacy (LDP) 本地差分隐私

不需要可信第三方,在向服务器发送梯度之前添加噪声。

H. Ren, J. Deng, and X. Xie, ‘‘GRNN: Generative regression neural network—A data leakage attack for federated learning,’’ CoRR, New York, NY, USA, Tech. Rep. 2105.00529, 2021.

上文成功的在当向梯度添加较小噪声时恢复了原始数据集

[41] T. Ha, T. K. Dang, T. T. Dang, T. A. Truong, and M. T. Nguyen, ‘‘Differential privacy in deep learning: An overview,’’ in Proc. Int. Conf. Adv. Comput. Appl. (ACOMP), Nov. 2019, pp. 97–102.

1)梯度级方法,包括向梯度添加噪声;2)函数级方法,包括向损失函数添加噪声;3)标签级方法,包括在训练期间向标签集添加噪声。

[42] A. Boulemtafes, A. Derhab, and Y. Challal, ‘‘A review of privacy preserving techniques for deep learning,’’ Neurocomputing, vol. 384, pp. 21–45, Apr. 2020

差分隐私及变体1.ϵ\epsilonϵ-DP,拉普拉斯噪声

DP包括向统计查询或原始数据集添加噪声,以便对手无法知道特定个人是否包含在数据集中。

ϵ\epsilonϵ代表了隐私损失,

敏感度:

ϵ\epsilonϵ-DP:

联邦学习(FL)+差分隐私(DP)

将隐私保护机制M应用于D和将M应用于D’时的输出相似,ϵ\epsilonϵ越小,相似程度越高。

值得一提的是,两种DP机制联合可以累加,可以应用于联邦学习:M1M_1M1​是ϵ1\epsilon_1ϵ1​-DP,M2M_2M2​是ϵ2\epsilon_2ϵ2​-DP,则M1,2M_{1,2}M1,2​是(ϵ1+ϵ2)(\epsilon_1+\epsilon_2)(ϵ1​+ϵ2​)-DP

对于联邦学习,如果一个客户端在把梯度发给服务器之前,将自己的梯度添加了一个ϵ\epsilonϵ-DP机制,在k-epochs之后,变为了(k∗ϵ)(k*\epsilon)(k∗ϵ)-DP。

2.(ϵ,δ)(\epsilon,\delta)(ϵ,δ)-DP,高斯噪声

添加δ\deltaδ是为了实现高斯噪声的差分隐私

两种噪声比较:

与高斯分布相比,拉普拉斯分布保证了强大的隐私保护,但以牺牲准确性为代价。

高斯分布比拉普拉斯分布具有更高的精度;这种差异随着ϵ\epsilonϵ的减小而增大。

Laplace机制

高斯机制

几何机制

几何机制是拉普拉斯机制的离散化版本

指数机制

适合随机应答机制

二项分布机制

DP机制最具挑战性的问题是,在FL中,由于噪声叠加,ϵ\epsilonϵ增加(见定理1)。随着训练轮数的增加,隐私泄漏会增加。隐私泄漏会随着k(epochs)的增加而增加。C. Dwork, G. N. Rothblum, and S. Vadhan, ‘‘Boosting and differential privacy,’’ in Proc. IEEE 51st Annu. Symp. Found. Comput. Sci., Oct. 2010, pp. 51–60提出了一种bound住K次叠加后的隐私预算ϵ\epsilonϵ。

提出了RDP,定义了一个更加严格的隐私预算界限,可以在K轮迭代后bound住ϵ\epsilonϵ

RDP基于Rényi散度,f-DP基于假设检验(通过权衡函数f参数化)

关于几种差分隐私变体的比较,参考[65] S. Asoodeh, J. Liao, F. P. Calmon, O. Kosut, and L. Sankar, ‘‘Three variants of differential privacy: Lossless conversion and applications,’’ IEEE J. Sel. Areas Inf. Theory, vol. 2, no. 1, pp. 208–222, Mar. 2021.

中心差分隐私CDP

相信服务器。将原始梯度发给服务器,服务器加噪

本地差分隐私LDPDP+同态加密HE/安全多方计算基于DP+FL的用户隐私保护DP+FL减少通信资源消耗

Google,Microsoft,Apple将随机应答RR差分隐私技术实际应用到了产品中

Apple:

Differential Privacy Team. (Dec. 2017). Learning With Privacy at Scale. [Online]. Available: https://machinelearning.apple.com/research/ learning-with-privacy-at-scale

Microsoft:

X. Ding, C. Wang, K.-K. Raymond Choo, and H. Jin, ‘‘A novel privacy preserving framework for large scale graph data publishing,’’ IEEE Trans. Knowl. Data Eng., vol. 33, no. 2, pp. 331–343, Feb. 2021

Google:

Ú. Erlingsson, V. Pihur, and A. Korolova, ‘‘RAPPOR: Randomized aggregatable privacy-preserving ordinal response,’’ in Proc. ACM SIGSAC Conf. Comput. Commun. Secur., Nov. 2014, pp. 1054–1067, doi: 10.1145/2660267.2660348.

RR(Randomized Response 随机应答:

RR技术包括以一定的概率翻转用户的真实答案,然后再将其发送给数据管理器。例如,一位社会科学家希望在保持隐私的同时,从吸毒者那里收集有关吸毒成瘾的统计数据;在回答问题之前,用户投掷一枚硬币:1)如果硬币正面朝上,则他/她会如实回答,否则2)用户投掷另一枚硬币,如果硬币正面朝上,则用户会如实回答,否则,用户会翻转他/她的回答。

FL + RR + computation/communication cost

可以研究的问题:FL + Laplace/Gauss/RR + communication/computation最有可能部署到实际应用的是跨设备联邦学习,移动端手机,由于手机的算力和存储空间有限,必须要考虑本地CPU计算的资源消耗和无线通信消耗。多轮迭代后,隐私预算呈倍数增长,需要差分隐私变体bound住隐私预算,看已经复现的FL+DP代码,因为无法bound住ϵ\epsilonϵ,在本地只进行了一轮迭代?差分隐私因为对梯度加了噪声,影响全局模型收敛LDP、CDP和GAN结合,目前找到一篇文章提出了用FL+DP来训练GAN: PRIVATE FL-GAN: DIFFERENTIAL PRIVACY SYNTHETIC DATA GENERATION BASED ON FEDERATED LEARNING【2020 IEEE INTERNATIONAL CONFERENCE 】Federated Learning With Differential Privacy: Algorithms and Performance Analysis【IEEE 2020】本文贡献:

1.在安全聚合前给模型参数添加高斯噪声

2.对训练好的FL模型的损失函数给出了一个收敛界: 1)更好的收敛性能导致更低的保护水平

​ 2)给定固定隐私保护级别的情况下,增加参与FL的总客户端数N可以提高收敛性能

​ 3)对于给定的保护级别,就收敛性能而言,存在一个最佳的最大聚合次数

3.提出了一种K客户机随机调度策略,从N个总体客户端中随机选择K个参与每轮聚合。得到了损失函数的收敛界。存在一个最佳K值,该值在固定的隐私级别下达到了最佳的收敛性能。

本文链接地址:https://www.jiuchutong.com/zhishi/297363.html 转载请保留说明!

上一篇:垃圾分类模型训练部署教程,基于MaixHub和MaixPy-k210(垃圾分类手工小模型)

下一篇:python和netlogo软件模拟病毒传播仿真模型(一)(net python)

  • iwatch怎么锁屏(iwatch怎么锁屏iphone)

    iwatch怎么锁屏(iwatch怎么锁屏iphone)

  • 抖音如何把字消除看全屏(怎样消去抖音上的字)

    抖音如何把字消除看全屏(怎样消去抖音上的字)

  • 支付宝挂失之后多久销户(支付宝挂失之后还能收款吗)

    支付宝挂失之后多久销户(支付宝挂失之后还能收款吗)

  • 美团高级水壶有什么用(美团高级水壶怎么拿)

    美团高级水壶有什么用(美团高级水壶怎么拿)

  • 抖音三千万音浪能换多少人民币(抖音三千万音浪多少钱)

    抖音三千万音浪能换多少人民币(抖音三千万音浪多少钱)

  • 苹果手机下载歌曲存储在哪里(苹果手机下载歌曲怎么设置铃声)

    苹果手机下载歌曲存储在哪里(苹果手机下载歌曲怎么设置铃声)

  • 在word中保护文档可以通过什么实现(word保护文档操作有哪些)

    在word中保护文档可以通过什么实现(word保护文档操作有哪些)

  • 已处理评价怎么去掉(已处理评价怎么p)

    已处理评价怎么去掉(已处理评价怎么p)

  • 耳机的r是左还是右边(耳机的r是左还是右)

    耳机的r是左还是右边(耳机的r是左还是右)

  • 苹果xr可以用两张电信卡吗(苹果xr可以用两张手机卡吗)

    苹果xr可以用两张电信卡吗(苹果xr可以用两张手机卡吗)

  • 发出的朋友圈能不能重新编辑(发出的朋友圈能编辑吗)

    发出的朋友圈能不能重新编辑(发出的朋友圈能编辑吗)

  • 快手怎么拍2分钟视频(快手拍5分长视频怎么操作拍)

    快手怎么拍2分钟视频(快手拍5分长视频怎么操作拍)

  • 电脑上显示windows副本不是正版是什么意思(电脑上显示windows未能启动怎么办)

    电脑上显示windows副本不是正版是什么意思(电脑上显示windows未能启动怎么办)

  • 共同一个ID查找定位会知道吗(同一id查找我的iphone会不会被发现)

    共同一个ID查找定位会知道吗(同一id查找我的iphone会不会被发现)

  • mate30支持5g么(华为mate30支持5g哪些频段)

    mate30支持5g么(华为mate30支持5g哪些频段)

  • 微信群能加多少人(微信群能加多少好友上限)

    微信群能加多少人(微信群能加多少好友上限)

  • 怎么删除退款详情里的内容(怎样删除退款记录)

    怎么删除退款详情里的内容(怎样删除退款记录)

  • 怎样在微信上打开微云(怎样在微信上打印文件)

    怎样在微信上打开微云(怎样在微信上打印文件)

  • 怎么解除菜鸟驿站黑名单(怎么解除菜鸟驿站绑定)

    怎么解除菜鸟驿站黑名单(怎么解除菜鸟驿站绑定)

  • 苹果11怎么信任软件(苹果11怎么信任企业级开发者)

    苹果11怎么信任软件(苹果11怎么信任企业级开发者)

  • 抖音拉黑能收消息吗(抖音拉黑了还能收到对方的私信吗)

    抖音拉黑能收消息吗(抖音拉黑了还能收到对方的私信吗)

  • 小米解锁机有什么坏处(小米解锁机有什么区别)

    小米解锁机有什么坏处(小米解锁机有什么区别)

  • 监控焦距是什么意思(监控的焦距是什么)

    监控焦距是什么意思(监控的焦距是什么)

  • 菜鸟驿站如何盈利(菜鸟驿站收益如何)

    菜鸟驿站如何盈利(菜鸟驿站收益如何)

  • 连不上网是什么原因(连不上网是什么原因出现感叹号)

    连不上网是什么原因(连不上网是什么原因出现感叹号)

  • MAC邮件客户端总是显示有未读邮件的解决方法(macbookair邮件)

    MAC邮件客户端总是显示有未读邮件的解决方法(macbookair邮件)

  • 在暴风雪中畅游的鸬鹚,德国黑森州 (© Wilfried Martin/Getty Images)(在暴风雪中求生)

    在暴风雪中畅游的鸬鹚,德国黑森州 (© Wilfried Martin/Getty Images)(在暴风雪中求生)

  • YOLOv8(n/s/m/l/x)&YOLOv7(yolov7-tiny/yolov7/yolov7x)&YOLOv5(n/s/m/l/x)不同模型参数/性能对比(含训练及推理速度)

    YOLOv8(n/s/m/l/x)&YOLOv7(yolov7-tiny/yolov7/yolov7x)&YOLOv5(n/s/m/l/x)不同模型参数/性能对比(含训练及推理速度)

  • 研发费用加计扣除是什么意思啊
  • 预付款被退回分录
  • 接受投资专利技术科目
  • 超市小票能否入库
  • 个体户查账征收需要交什么税
  • 经营活动现金流量公式
  • 年终奖分摊到每个月
  • 固定资产清理费用为什么有进项税额
  • 未支付的货款属于什么会计科目
  • 个税手续费返还计入哪个科目
  • 不征收耕地占用税的情形
  • 应付账款借方余额在资产负债表中怎么列示
  • 银行利息税是多少2021
  • 收购企业账务处理
  • 地质灾害评估费收费标准
  • 交易性金融资产的交易费用计入哪里
  • 发生销售折扣如何做账
  • 怎么查找使用手机的时间
  • 固定资产折旧结束后怎样做账
  • 延期申报增值税罚款
  • 企业销售产品的会计分录
  • 买二手车转让费一般要多少钱
  • 减少其他应付款冲费用做以前年度损益调整如何做分录
  • 个人业务费是什么
  • 未完工产品成本计算公式
  • 穿越火线下载安装
  • 什么情况下出租人可以解除合同
  • linux grep使用
  • taskhost window
  • 营改增后哪些费用可以抵扣
  • php基本操作
  • 生产加工型企业安全隐患排查内容
  • 用应付票据付应付账款
  • 小规模纳税人避税
  • 工程服务费会计怎么做账
  • 2023华为OD机试题
  • 职工医保报销后病情会泄露给单位吗
  • 提取企业所得税怎么做会计科目
  • 折扣和佣金合法的两个条件是什么?
  • 城镇土地使用税每年都要交吗
  • 如何用ps做半圆
  • 一般纳税人第一次申请发票
  • 递延收益核算哪些内容
  • 会计的借记和贷记什么意思
  • 外购豆油给送客户好吗
  • 出口退税是先交税后退税吗
  • 调账和调帐区别
  • 厂家返利怎么入账
  • 企业自有房产的认定标准
  • 纸质银行承兑到期怎么办
  • 长期待摊费用待摊费用
  • 工程安装公司注册条件
  • 工程结算直接做主营业务成本
  • 用白纸写的收据怎么入帐?
  • 预收账款最后怎么处理
  • 银行手续费没拿可以退吗
  • 应交消费税等于
  • 补计提上一年度工资
  • 残疾人保障金的工资按实发还是应发
  • 企业要建账需留什么资料
  • 寻找sql注入漏洞存在哪几个关键点
  • sql防御
  • linux命令视频讲解
  • 卡巴斯基 试用
  • fedora linux安装教程
  • SUSE Linux Enterprise Server 11 SP1 安装教程图文详解
  • windows 7磁盘
  • linux系统中常用的五种文件类型
  • linux用户账户管理
  • linux rpm包位置
  • Win10 Mobile Redstone版本号确定为Build 11082明年发布
  • 打开应用通知栏
  • perl cgi
  • jquery替换div内容
  • python jose
  • jquery中的$是什么
  • 工具的图
  • 红杏是什么意思什么样的
  • 社保费是国税还是地税
  • 免责声明:网站部分图片文字素材来源于网络,如有侵权,请及时告知,我们会第一时间删除,谢谢! 邮箱:opceo@qq.com

    鄂ICP备2023003026号

    网站地图: 企业信息 工商信息 财税知识 网络常识 编程技术

    友情链接: 武汉网站建设