Key points are not available for this paper at this time.
L'utilisation croissante des agents de conversation basés sur des modèles de langage de grande taille (LLM) pour gérer des données sensibles des utilisateurs soulève d'importantes préoccupations en matière de confidentialité. Bien que ces agents excellent dans la compréhension et l'action en fonction du contexte, cette capacité peut être exploitée par des acteurs malveillants. Nous introduisons un nouveau modèle de menace où des applications tierces adversariales manipulent le contexte d'interaction pour tromper les agents basés sur LLM afin de révéler des informations privées non pertinentes pour la tâche à accomplir. Ancré dans le cadre de l'intégrité contextuelle, nous présentons AirGapAgent, un agent soucieux de la vie privée conçu pour prévenir les fuites de données involontaires en restreignant l'accès de l'agent uniquement aux données nécessaires pour une tâche spécifique. D'amples expériences utilisant les modèles Gemini, GPT et Mistral en tant qu'agents valident l'efficacité de notre approche dans l'atténuation de cette forme de détournement de contexte tout en maintenant la fonctionnalité de base de l'agent. Par exemple, nous montrons qu'une attaque de détournement de contexte à requête unique sur un agent Gemini Ultra réduit sa capacité à protéger les données des utilisateurs de 94 % à 45 %, tandis qu'un AirGapAgent atteint une protection de 97 %, rendant la même attaque inefficace.
Bagdasaryan et al. (mercredi,) ont étudié cette question.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: