Key points are not available for this paper at this time.
La protection de la vie privée de la contribution entière des utilisateurs en termes d'échantillons est importante dans les systèmes distribués. L'approche la plus efficace est le schéma en deux étapes, qui trouve d'abord un petit intervalle puis obtient une estimation affinée en coupant les échantillons dans cet intervalle. Cependant, l'opération de découpe induit un biais, qui est sérieux si la distribution des échantillons est à queue lourde. De plus, les utilisateurs avec de grandes tailles d'échantillons locaux peuvent rendre la sensibilité beaucoup plus grande, rendant ainsi la méthode inadaptée aux utilisateurs déséquilibrés. Motivés par ces défis, nous proposons une approche de minimisation de la perte de Huber pour l'estimation de la moyenne sous la confidentialité différentielle au niveau des utilisateurs. Les points de connexion de la perte de Huber peuvent être ajustés de manière adaptative pour faire face aux utilisateurs déséquilibrés. De plus, cela évite l'opération de découpe, réduisant ainsi considérablement le biais par rapport à l'approche en deux étapes. Nous fournissons une analyse théorique de notre approche, qui donne la force du bruit nécessaire pour la protection de la vie privée, ainsi que la limite de l'erreur quadratique moyenne. Le résultat montre que la nouvelle méthode est beaucoup moins sensible au déséquilibre des tailles d'échantillons au niveau des utilisateurs et à la queue des distributions d'échantillons. Enfin, nous réalisons des expériences numériques pour valider notre analyse théorique.
Zhao et al. (mer,) ont étudié cette question.