Key points are not available for this paper at this time.
Les modèles d'apprentissage automatique intègrent souvent d'énormes quantités de données, soulevant d'importantes préoccupations en matière de confidentialité. L'apprentissage automatique inversé, la capacité à supprimer l'influence de points de données spécifiques d'un modèle entraîné, répond à ces préoccupations. Cet article explore des méthodes pratiques pour mettre en œuvre l'apprentissage automatique inversé, en se concentrant sur une approche de montée de gradient du premier epoch. Les principales conclusions incluent : 1. Apprentissage inversé à un ou plusieurs epochs : L'apprentissage inversé par gradient du premier epoch est plus efficace que les gradients de plusieurs epochs. 2. Apprentissage inversé basé sur les couches : La couche d'embedding dans GPT-2 est cruciale pour un apprentissage efficace. Les gradients des couches de sortie (11 et 12) n'ont aucun impact. Un apprentissage inversé efficace peut être réalisé en utilisant uniquement la couche d'embedding, réduisant de moitié la complexité spatiale. 3. Fonctions d'influence et score : Des techniques comme le produit vectoriel Hessien et le produit scalaire des activations et des tenseurs sont utilisées pour quantifier l'apprentissage inversé. 4. Considérations sur la montée de gradient : Une calibration est nécessaire pour éviter de surexposer le modèle à des points de données spécifiques pendant l'apprentissage inversé, ce qui pourrait mettre prématurément fin au processus. 5. Correspondance floue vs. apprentissage itératif : Les techniques de correspondance floue déplacent le modèle vers un nouvel optimum, tandis que l'apprentissage itératif fournit une modalité plus complète. Notre évaluation empirique confirme que la montée de gradient du premier epoch pour l'apprentissage automatique inversé est plus efficace que la montée de gradient sur l'ensemble du modèle. Ces résultats mettent en évidence le potentiel de l'apprentissage inversé pour améliorer la confidentialité des données et la conformité aux réglementations telles que le RGPD et la CCPA. L'étude souligne l'importance des méthodes formelles pour évaluer de manière exhaustive le processus d'apprentissage inversé.
David Zagardo (jeu,) a étudié cette question.