Les modèles de fondation en vision ont démontré une forte généralisation dans la segmentation d'images médicales grâce à un préentraînement à grande échelle et hétérogène. Cependant, ils ont souvent du mal à se généraliser à des tâches cliniques spécialisées sous des annotations limitées ou des variations pathologiques rares, en raison d'un décalage entre les priors généraux et les exigences spécifiques à la tâche. Pour y remédier, nous proposons un Apprentissage collaboratif informé par l'incertitude (UnCoL), un cadre à double enseignant qui harmonise généralisation et spécialisation dans la segmentation d'images médicales semi-supervisée. Plus précisément, UnCoL distille des représentations à la fois visuelles et sémantiques d'un modèle de fondation gelé pour transférer des connaissances générales, tout en maintenant simultanément un enseignant en adaptation progressive pour capturer des représentations fines et spécifiques à la tâche. Pour équilibrer les conseils des deux enseignants, l'apprentissage par étiquettes pseudo dans UnCoL est régulé de manière adaptative par l'incertitude prédictive, qui supprime sélectivement la supervision peu fiable et stabilise l'apprentissage dans des régions ambiguës. Des expériences sur divers benchmarks 2D et 3D montrent qu'UnCoL surpasse constamment les méthodes existantes dans la plupart des ensembles de données et des métriques, tout en atteignant des performances comparables dans seulement quelques cas. De plus, notre modèle fournit une performance presque totalement supervisée avec des exigences d'annotation considérablement réduites. Le code est disponible à : https://github.com/VivienLu/UnCoL.
Lu et al. (Jeu,) ont étudié cette question.