構造-物性モデリングのための十分なトレーニングセットの収集は、特にニッチな吸着系においてしばしば大きな課題となります。本研究は、分子物性予測におけるデータ不足の課題に対する有力な解決策を示すメタ学習の計算実験を提供します。我々の解析では、いくつかのイオン液体-溶質システムにおける無限希釈活性係数を利用し、特定の溶質を持つシステムごとに係数予測をタスクとして扱いました。システムは主にモデルに依存しないメタ学習(MAML)を用いてモデリングされ、Reptileおよびその修正版の研究がそれを補足しました。得られた結果は、適応セットサイズの拡大によるMAMLモデルのトレーニングに有望な知見を提供します。R²、RMSE、およびMAEといった指標は、わずか64または128のデータポイントでトレーニングされた場合でも、グラフニューラルネットワークと同等の性能を示しています。ファインチューニングされたモデルの多用途性は、場合によっては単一タスクの性能が犠牲になる(破滅的忘却)ことを示唆しています。テストとトレーニングタスク間の類似性(溶質分子のタニモト類似度で近似)は、テストタスクの性能に影響を及ぼす要因として特定されました。これにより、Task Similarity-Aware Reptile(TSA-Reptile)が異質なタスクに対応するため提案されました。この新しい方法は、損失関数を最近傍のトレーニングタスクとの類似度でスケールします。TSA-Reptileは分布外タスクにおいてMAMLを上回る性能を示しました。メタ学習と従来の深層学習の比較分析に加え、MAMLとTSA-Reptileの潜在的強みについても議論しています。
Baranら(Mon,)がこの問題を研究しました。