Key points are not available for this paper at this time.
差分隐私最近在私人统计数据发布中成为最强隐私保障之一。发布模仿原始数据的差分隐私合成数据为隐私保护的数据共享和分析提供了一种有前景的方法,同时提供严格的隐私保证。然而,迄今为止,还没有开源工具允许用户生成差分私有的合成数据,尤其是对于高维和大范围数据。现有的大多数生成差分隐私直方图或合成数据的技术仅适用于一维或低维直方图。由于扰动误差和计算复杂度的增加,它们对于高维和大范围数据变得问题重重。我们提出了DPSynthesizer,这是一个用于差分私有数据合成的工具包。DPSynthesizer的核心是DPCopula,旨在处理高维和大范围数据。DPCopula从中计算出可以抽样的差分隐私copula函数。Copula函数用于描述多元随机向量之间的依赖关系,并允许我们使用一维边际分布构建多元联合分布。DPSynthesizer还实现了一套最先进的方法,用于构建适合低维数据的差分隐私直方图,从中可以生成合成数据。我们将使用DPCopula和其他方法,通过各种数据集展示系统,并展示各种方法的可行性、实用性和有效性.
Li等人(星期五)研究了这个问题。