潮科技｜隐私计算技术的三大主流门派(12)

2023-06-03 来源:旧番剧

差分隐私的主要实现机制，主要是在输入或输出上加入随机化的噪音：拉普拉斯噪音(Laplace Noise)，高斯噪音(Gaussian Noise)，指数机制等
一些企业已经开展了相关的工程实践。Google利用本地化差分隐私保护技术从Chrome浏览器每天采集超过1400万用户行为统计数据。在2016年WWDC主题演讲中，苹果工程副总裁Craig Federighi宣布苹果使用本地化差分隐私技术来保护iOS/MacOS用户隐私。根据其官网披露的消息，苹果将该技术应用于Emoji、QuickType输入建议、查找提示等领域。例如，Count Mean Sketch算法（CMS）帮助苹果获得最受欢迎的Emoji表情用来进一步提升Emoji使用的用户体验，下图展示了利用该技术获得的US English使用者的表情使用倾向。

差分隐私用于表情使用统计
差分隐私具有三个最重要的优点：
(1) 差分隐私严格定义了攻击者的背景知识：除了某一条记录，攻击者知晓原数据中的所有信息——这样的攻击者几乎是最强大的，而差分隐私在这种情况下依然能有效保护隐私信息；
(2) 差分隐私拥有严谨的统计学模型，极大地方便了数学工具的使用以及定量分析和证明。
(3) 差分隐私不需要特殊的攻击假设，不关心攻击者拥有的背景知识，量化分析隐私泄露风险。
4.2 K匿名算法
在大数据的时代，很多机构需要面向公众或研究者发布其收集的数据，例如医疗数据，地区政务数据等。这些数据中往往包含了个人用户或企业用户的隐私数据，这要求发布机构在发布前对数据进行脱敏处理。K匿名算法是比较通用的一种数据脱敏方法。
举例来说，如下图是两张表，一张是用户的会员注册信息表，一张是对外发布的医疗信息表。