Key points are not available for this paper at this time.
Résumé Dans cet article, nous étudions la calibration post-hoc des réseaux de neurones modernes, un problème qui a suscité beaucoup d'attention ces dernières années. Malgré la pléthore de méthodes de calibration proposées, il n'y a pas encore de consensus sur la complexité inhérente de la tâche et, tandis que certains auteurs affirment que des fonctions simples résolvent le problème, d'autres suggèrent que des modèles plus expressifs sont nécessaires pour capturer la mauvaise calibration. Comme première approche, nous nous concentrons sur la tâche de mise à l'échelle de la confiance, en particulier sur les méthodes post-hoc qui généralisent la mise à l'échelle de la température, que nous appelons la famille de la mise à l'échelle de la température adaptative. Nous commençons par démontrer que, bien que des modèles complexes comme les réseaux de neurones offrent un avantage lorsqu'il y a beaucoup de données, ils échouent dans des scénarios où elles sont limitées, notamment courants dans des domaines comme le diagnostic médical. Nous montrons ensuite comment, dans ces conditions idéales de données, les méthodes plus expressives apprennent une relation entre l'entropie d'une prédiction et son niveau de surconfiance, et sur cette observation, nous proposons une mise à l'échelle de la température basée sur l'entropie, une méthode simple qui ajuste la confiance d'une prédiction selon cette relation. Les résultats montrent que notre méthode obtient des performances de pointe et est robuste face à la rareté des données. De plus, notre modèle proposé permet une compréhension plus approfondie du processus de calibration par l'interprétation de l'entropie comme une mesure d'incertitude dans les sorties du réseau.
Balanya et al. (Mer,) ont étudié cette question.