Key points are not available for this paper at this time.
L'apprentissage séquentiel, également appelé apprentissage tout au long de la vie, étudie le problème de l'apprentissage de tâches dans une séquence avec un accès restreint uniquement aux données de la tâche actuelle. Dans cet article, nous examinons un scénario avec une capacité de modèle fixe et postulons que le processus d'apprentissage ne doit pas être égoïste, c'est-à-dire qu'il doit tenir compte des futures tâches à ajouter et ainsi laisser suffisamment de capacité pour elles. Pour atteindre un apprentissage séquentiel altruiste, nous étudions différentes stratégies de régularisation et fonctions d'activation. Nous découvrons que l'imposition de la parcimonie au niveau de la représentation (c'est-à-dire les activations des neurones) est plus bénéfique pour l'apprentissage séquentiel que l'encouragement de la parcimonie des paramètres. En particulier, nous proposons un nouveau régulateur, qui encourage la parcimonie de la représentation par le biais d'une inhibition neuronale. Cela entraîne peu de neurones actifs, ce qui laisse plus de neurones libres à utiliser par les tâches à venir. Comme l'inhibition neuronale sur une couche entière peut être trop drastique, en particulier pour des tâches complexes nécessitant des représentations fortes, notre régulateur n'inhibe que d'autres neurones dans un voisinage local, inspiré par des processus d'inhibition latérale dans le cerveau. Nous combinons notre nouveau régulateur avec des méthodes d'apprentissage tout au long de la vie à la pointe de la technologie qui pénalisent les changements aux parties importantes déjà apprises du réseau. Nous montrons que notre nouveau régulateur conduit à une sparsité accrue qui se traduit par une amélioration de performance cohérente par rapport aux régulateurs alternatifs que nous avons étudiés sur divers ensembles de données.
Aljundi et al. (Jeu,) ont étudié cette question.