Key points are not available for this paper at this time.
Résumé Les grands modèles de langage (LLMs) ont déclenché une nouvelle vague de chaleur de l'IA en raison de leur capacité à engager les utilisateurs finaux dans des conversations de niveau humain avec des réponses détaillées et articulées dans de nombreux domaines de connaissance. En réponse à leur adoption rapide dans de nombreuses applications industrielles, cette enquête concerne leur sécurité et leur fiabilité. Tout d'abord, nous examinons les vulnérabilités et les limites connues des LLMs, les classant en problèmes inhérents, attaques et bugs non intentionnels. Ensuite, nous considérons si et comment les techniques de Vérification et Validation (V&V), qui ont été largement développées pour les logiciels traditionnels et les modèles d'apprentissage profond tels que les réseaux de neurones convolutifs en tant que processus indépendants pour vérifier l'alignement de leurs mises en œuvre par rapport aux spécifications, peuvent être intégrées et davantage étendues tout au long du cycle de vie des LLMs pour fournir une analyse rigoureuse de la sécurité et de la fiabilité des LLMs et de leurs applications. Plus précisément, nous considérons quatre techniques complémentaires : falsification et évaluation, vérification, surveillance à l'exécution et réglementations et utilisation éthique. Au total, plus de 370 références sont considérées pour soutenir la compréhension rapide des problèmes de sécurité et de fiabilité du point de vue de la V&V. Bien qu'une recherche intensive ait été menée pour identifier les problèmes de sécurité et de fiabilité, des méthodes rigoureuses mais pratiques sont nécessaires pour garantir l'alignement des LLMs avec les exigences de sécurité et de fiabilité.
Huang et al. (Mon,) ont étudié cette question.