首发于Paper十问
ICLR 2022 | 十问读 Improving Federated Learning Face Recognition via Privacy-Agnostic Clusters

ICLR 2022 | 十问读 Improving Federated Learning Face Recognition via Privacy-Agnostic Clusters

本论文入选了ICLR 2022会议,并获得了Spotlight。在ICLR2022线上分享会议活动中,ReadPaper邀请到了本文第一作者孟强进行线上分享,并邀其回答了ReadPaper十问,在详细阅读论文之前不妨先速读十问做个初步了解。


论文阅读链接:


Q1

论文试图解决什么问题?

联邦学习在人脸识别任务上因为类中心的隐私问题,并不能达到很好的效果。本文试图通过分享去隐私的类中心信息提升联邦人脸识别性能。


Q2

这是否是一个新的问题?

算是新问题。联邦学习在人脸识别只有几篇工作,且如何给给类中心去隐私并提升性能是个新问题。


Q3

这篇文章要验证一个什么科学假设?

通过从类中心提取去隐私的群体信息,对联邦人脸识别取得更好的特征空间有促进作用。


Q4

有哪些相关研究?如何归类?谁是这一课题在领域内值得关注的研究员?

联邦人脸识别相关相关研究有3篇[1,2,3]。其中第一篇将类中心上传至服务器进行空间优化。第二,三篇用额外的可以共享的数据来finetune或者蒸馏,达到空间一致的效果。

差分隐私在深度学习的应用也很相关,推荐想了解差分隐私的同学参考Cynthia Dwork的The Algorithmic Foundations of Differential Privacy。

[1] (IJCB2021) FedFace: Collaborative learning of face recognition model.

[2] (arXiv2021) Federated face recognition.

[3] (AAAI2021) FedFR: Joint optimization federated framework for generic and personalized face recognition..


Q5

论文中提到的解决方案之关键是什么?

关键是如何设计算法能够(1)从本地类中心中提取出群体信息;(2)有理论隐私保证; (3)保证差分隐私的加噪操作不会过多影响信息的效用;(4)如何利用去隐私信息帮助得到全局一致解。


Q6

论文中的实验是如何设计的?

主要实验是利用BUPT-balancedface的四个子人种数据集模拟联邦学习的四个client,模拟普通联邦学习和privacyface框架在若干通信后的性能比对。RFW的四个子数据集和IJB作为实验的主要benchmark。


Q7

用于定量评估的数据集是什么?代码有没有开源?

数据集包括BUPT-BalancedFace, RFW, IJB-B, IJB-C,代码尚未开源。


Q8

论文中的实验及结果有没有很好地支持需要验证的科学假设?

量化实验,可视化实验和消融实验,我(作者)认为是支持了假设。


Q9

这篇论文到底有什么贡献?

1. 提出了一个差分隐私局部聚类算法DPLC,并证明该算法复杂度低,拥有严格理论隐私保护并有很强抗干扰能力。

2. 提出全局一致性人脸识别损失函数,能够利用去隐私的信息极大幅度提高联邦学习在人脸识别的性能。


Q10

下一步呢?有什么工作可以继续深入?

本文的性能方面离完美的全局训练还是有很大的提升空间。下一步可能的优化的点包括:

1. 设计隐私级别更高,效果更好的提取信息算法。

2. 尽管没有分类层的强隐私相关,底座网络也有隐私泄露的风险(通过梯度分析推断可能产生该梯度的数据点)。可以进一步加入现有的differntially private federated learning方法减小隐私风险(论文Sec.A. 3也提到)。

3. 文章还有一个假设是client的训练数据有一部分有本地独特的特性并可以聚类。下一步可以考虑如何优化训练去减弱这个假设。

4. 隐私保护有三个比较重要的工具:差分隐私(DP),多方安全计算(MPC)和同态加密(HE)。MPC和HE能够得到基本无损的性能,是未来提升精度的可能方向。

发布于 2022-03-22 11:33