June 19, 2024Open Access

Contrôler l’oubli avec des données en temps de test dans l'apprentissage continu

Key Points

Key points are not available for this paper at this time.

Abstract

Les modèles fondamentaux de vision-langage ont montré des performances impressionnantes sur diverses tâches en aval. Pourtant, il est toujours urgent de mettre à jour ces modèles plus tard, à mesure que de nouvelles tâches ou domaines deviennent disponibles. La recherche continue sur l'apprentissage continu (CL) fournit des techniques pour surmonter l'oubli catastrophique des informations précédentes lors de l'acquisition de nouvelles connaissances. À ce jour, les techniques de CL ne se concentrent que sur les sessions d'entraînement supervisées. Cela entraîne un oubli significatif donnant lieu à des performances inférieures, même par rapport à la performance zéro coup du modèle précédent. Dans ce travail, nous soutenons que les données en temps de test contiennent de grandes informations qui peuvent être exploitées de manière auto-supervisée pour rafraîchir la mémoire du modèle sur les tâches précédemment apprises et ainsi réduire considérablement l'oubli sans coût supplémentaire de traçage. Nous étudions comment les données non supervisées peuvent être employées en ligne pour améliorer les performances des modèles sur les tâches antérieures lorsqu'elles rencontrent des échantillons représentatifs. Nous proposons un modèle étudiant-enseignant simple mais efficace avec des mises à jour des paramètres rares basées sur le gradient et montrons des améliorations significatives des performances et une réduction de l'oubli, ce qui pourrait atténuer le rôle d'une mémoire/expérience épisodique hors ligne.

Contrôler l’oubli avec des données en temps de test dans l'apprentissage continu

Key Points

Abstract

Cite This Study