Décontamination au moment de l'inférence : réutilisation des benchmarks divulgués pour l'évaluation des grands modèles de langage | Synapse