Key points are not available for this paper at this time.
Dados de sequência temporal relacionados a usuários, como históricos médicos e dados de mobilidade, são bons candidatos para mineração de dados, mas frequentemente contêm informações altamente sensíveis. Métodos diferentes de publicação de dados que preservam a privacidade são utilizados para liberar esses dados privados, de modo que registros individuais nos dados liberados não possam ser reatados a usuários específicos com um alto grau de certeza. Esses métodos fornecem riscos teóricos de privacidade em cenários extremos como medidas da proteção à privacidade que oferecem. No entanto, muitas vezes, com muitos dados do mundo real, o cenário extremo é excessivamente pessimista e não fornece uma visão realista dos riscos de privacidade: a verdadeira probabilidade de reidentificação é frequentemente muito mais baixa do que o risco teórico em caso de pior cenário. Neste artigo, propomos um novo modelo de risco empírico para privacidade que, em relação ao custo de ataques à privacidade, demonstra melhor os riscos práticos associados à liberação de dados que preservam a privacidade. Mostramos uma avaliação detalhada do modelo de risco proposto usando dados de mobilidade do mundo real k-anonimizados e, em seguida, mostramos como a avaliação empírica do risco de privacidade apresenta uma tendência diferente em dados sintéticos que descrevem movimentos aleatórios.
Basu et al. (Sex,) estudaram essa questão.