분자 특성 예측은 양자 화학, 케미인포매틱스, 딥러닝을 결합하여 분자 구조와 물리화학적 및 생물학적 행동을 연결합니다. 이 조사는 양자, 서술자 기계 학습, 기하학적 딥러닝, 기초 모델 등 네 가지 상호 보완적 패러다임을 추적하고, 분자 표현, 모델 아키텍처 및 학제간 응용을 연결하는 통합 분류법을 제시합니다. 벤치마크 분석은 광범위하게 사용되는 데이터 세트와 산업 관점을 반영한 데이터 세트 모두의 증거를 통합하며, 양자, 물리화학, 생리학 및 생체물리학 영역을 포함합니다. 이 조사는 데이터 큐레이션, 분할 전략 및 평가 프로토콜의 현재 표준을 점검하고, 불일치 입체화학, 이질적 검사 출처 및 무작위 또는 명확하지 않은 분할 하에서 재현성 제한과 같은 문제를 강조합니다. 이러한 관찰은 더 투명하고 시간 및 골격 인지 방법론을 향한 벤치마크 설계의 현대화를 촉진합니다. 또한, (i) 양자 일관성을 내장한 물리 인지 학습, (ii) 신뢰할 수 있는 추론을 위한 불확실성 보정 기초 모델, (iii) 계산 및 실험 데이터를 통합하는 현실적인 다중 모달 벤치마크 생태계 등 세 가지 미래 지향적 방향을 제안합니다. 저장소: https://github.com/Zongru-Li/Survey-and-Benchmarks-of-DL-for-Molecular-Property-Prediction-in-the-Foundation-Model-Era.
Li 등(목요일)이 이 질문을 연구했습니다.