연소열(HoC)의 정확한 예측은 연료 설계 및 화학 안전성 평가에 필수적입니다. 본 연구에서는 4516개 화합물 데이터셋을 대상으로 연소열 값을 예측하는 능력을 평가하기 위해 XGBoost, 다층 퍼셉트론(MLP), 그래프 컨볼루션 네트워크(GCN), 신경망 컨볼루션(NNConv) 등 네 가지 머신러닝 모델을 체계적으로 비교하였습니다. 결과는 디스크립터 기반 접근법(XGBoost 및 MLP)이 더 빠른 학습 시간(약 34-60초)과 더 낮은 최종 테스트 오차(각각 2.08 및 2.31 kJ/g)를 보였으며, 특히 MLP는 가장 높은 결정 계수(R2 = 0.942)를 기록함을 보여주었습니다. 반면 그래프 기반 모델(GCN 및 NNConv)은 훨씬 긴 실행 시간(약 360-2700초)이 소요되었으나, 에폭 당 더 빠르게 수렴하고 과적합이 적으며 견고한 일반화 능력과 안정적인 오차 분포를 나타냈습니다. 잔차 및 밀도 분석에서 NNConv는 실험 값 주위에서 가장 조밀한 클러스터링을 보이며 높은 예측 충실도를 반영함을 확인했습니다. 중요하게도, 20 kJ/g 임계값을 적용한 GHS/CLP 위험 분류에서 모든 모델은 가연성 및 비가연성 화합물을 신뢰성 있게 구분하였고, 모델별 모호 영역은 경계 사례를 강조했습니다. GHS/CLP 가연성 기준에 따른 분류 오류 영향 분석 결과, NNConv가 최소한의 거짓 음성으로 전반적으로 최고의 성능을 달성함을 나타냈습니다. 이 결과는 분자 특성 예측에서 계산 효율성과 표현의 풍부함 간의 상쇄 관계를 강조하며, 디스크립터 기반과 그래프 기반 모델 모두 규제 적용을 위한 효과적인 고처리량 스크리닝 도구가 될 수 있음을 보여줍니다.
Nnyigide 등(Sun,)이 이 질문을 연구함.