Key points are not available for this paper at this time.
La généralisation aux données non vues est un désir clé pour les réseaux profonds, mais sa relation avec la précision de classification n'est pas claire. En utilisant un jeu de données visuelles minimaliste et une mesure de généralisation, nous montrons que les réseaux populaires, des réseaux de neurones convolutifs profonds (CNN) aux transformateurs, varient dans leur capacité à extrapoler vers des classes non vues à la fois à travers les couches et les architectures. La précision n'est pas un bon prédictif de généralisation, et la généralisation varie de manière non monotone avec la profondeur des couches. Le code est disponible sur https://github.com/dyballa/zero-shot-generalization.
Gerrtiz et al. (mercredi) ont étudié cette question.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: