Key points are not available for this paper at this time.
A privacidade diferencial surgiu como um dos modelos de privacidade mais promissores para a liberação de dados privados. Pode ser utilizada para liberar diferentes tipos de dados e, em particular, histogramas, que fornecem resumos úteis de um conjunto de dados. Vários esquemas de liberação de histogramas com privacidade diferencial foram propostos recentemente. No entanto, a maioria deles adiciona diretamente ruído às contagens dos histogramas, resultando em precisão indesejável. Neste artigo, propomos duas técnicas de sanitização que exploram a redundância inerente de conjuntos de dados da vida real a fim de aumentar a precisão dos histogramas. Elas comprimem os dados de forma lossa e sanitizam os dados comprimidos. Nosso primeiro esquema é uma otimização do Algoritmo de Perturbação de Fourier (FPA) apresentado em 13. Ele melhora a precisão do FPA inicial em um fator de 10. O outro esquema depende de agrupamento e explora a redundância entre os intervalos. Nossa extensa avaliação experimental em vários conjuntos de dados reais e sintéticos demonstra que nossas técnicas preservam distribuições muito precisas e melhoram consideravelmente a precisão de consultas de intervalo sobre histogramas atribuídos.
Ács et al. (Sáb,) estudaram essa questão.