潮科技|隐私计算技术的三大主流门派(12)
2023-06-03 来源:旧番剧
差分隐私的主要实现机制,主要是在输入或输出上加入随机化的噪音:拉普拉斯噪音(Laplace Noise),高斯噪音(Gaussian Noise),指数机制等
一些企业已经开展了相关的工程实践。Google利用本地化差分隐私保护技术从Chrome浏览器每天采集超过1400万用户行为统计数据。在2016年WWDC主题演讲中,苹果工程副总裁Craig Federighi宣布苹果使用本地化差分隐私技术来保护iOS/MacOS用户隐私。根据其官网披露的消息,苹果将该技术应用于Emoji、QuickType输入建议、查找提示等领域。例如,Count Mean Sketch算法(CMS)帮助苹果获得最受欢迎的Emoji表情用来进一步提升Emoji使用的用户体验,下图展示了利用该技术获得的US English使用者的表情使用倾向。
差分隐私用于表情使用统计
差分隐私具有三个最重要的优点:
(1) 差分隐私严格定义了攻击者的背景知识:除了某一条记录,攻击者知晓原数据中的所有信息——这样的攻击者几乎是最强大的,而差分隐私在这种情况下依然能有效保护隐私信息;
(2) 差分隐私拥有严谨的统计学模型,极大地方便了数学工具的使用以及定量分析和证明。
(3) 差分隐私不需要特殊的攻击假设,不关心攻击者拥有的背景知识,量化分析隐私泄露风险。
4.2 K匿名算法
在大数据的时代,很多机构需要面向公众或研究者发布其收集的数据,例如医疗数据,地区政务数据等。这些数据中往往包含了个人用户或企业用户的隐私数据,这要求发布机构在发布前对数据进行脱敏处理。K匿名算法是比较通用的一种数据脱敏方法。
举例来说,如下图是两张表,一张是用户的会员注册信息表,一张是对外发布的医疗信息表。