La collecte d'ensembles de données d'entraînement substantiels pour la modélisation structure-propriété pose souvent un défi important, notamment pour les systèmes de sorption de niche. Cette étude propose des expériences informatiques avec le méta-apprentissage, qui offre une solution convaincante au problème de la rareté des données dans la prédiction des propriétés moléculaires. Notre analyse a utilisé des coefficients d'activité en dilution infinie pour plusieurs systèmes liquide ionique-soluté, la prédiction du coefficient pour un système avec un soluté particulier constituant une tâche. Les systèmes ont été modélisés principalement à l'aide du méta-apprentissage agnostique au modèle (MAML), soutenu par une étude sur Reptile et ses variantes modifiées. Les résultats obtenus fournissent des indications prometteuses sur l'entraînement des modèles MAML en augmentant la taille de l'ensemble d'adaptation. Des métriques telles que R2, RMSE et MAE indiquent une performance comparable à celle des réseaux neuronaux graphiques, même lorsqu'ils sont entraînés sur seulement 64 ou 128 points de données. La polyvalence des modèles ajustés suggère que, dans certains cas, une performance sur une tâche unique peut être atteinte au prix d'une réduction de la polyvalence du modèle (oubli catastrophique). La similarité entre les tâches de test et d'entraînement (approximée par la similarité de Tanimoto des molécules des solutés) a été identifiée comme un facteur affectant la performance sur la tâche de test. Par conséquent, Task Similarity-Aware Reptile (TSA-Reptile) a été proposé pour cibler ces tâches dissemblables. Cette méthode novatrice scale la fonction de perte selon la similarité avec la tâche d'entraînement la plus proche. Il a été démontré qu'elle surpasse MAML sur des tâches hors distribution. Au-delà de l'analyse comparative du méta-apprentissage et de l'apprentissage profond traditionnel, les forces potentielles de MAML et TSA-Reptile sont discutées.
Baran et al. (Mon,) ont étudié cette question.