What question did this study set out to answer?

연소열 예측을 위해 딥러닝 그래프 신경망과 고전적 머신러닝 모델을 비교하는 것을 목표로 함

March 18, 2026Open Access

GHS/CLP 기준하의 주요 위험 지표로서 연소열 예측을 위한 딥러닝 그래프 신경망과 고전적 머신러닝 모델의 비교 평가

Key Points

연소열 예측을 위해 딥러닝 그래프 신경망과 고전적 머신러닝 모델을 비교하는 것을 목표로 함
네 가지 모델 평가: XGBoost, 다층 퍼셉트론, 그래프 컨볼루션 네트워크, 신경망 컨볼루션
4516개 화합물 데이터셋을 사용하여 예측 수행
각 모델의 학습 시간, 테스트 오류, 예측 충실도 평가
디스크립터 기반 모델(XGBoost 및 MLP)이 그래프 기반 모델보다 빠른 학습 시간과 낮은 오류를 기록함
MLP가 최고 R2 값 0.942 달성
NNConv는 최소한의 거짓 음성으로 연소열 예측에서 최고 성능을 보임

Abstract

연소열(HoC)의 정확한 예측은 연료 설계 및 화학 안전성 평가에 필수적입니다. 본 연구에서는 4516개 화합물 데이터셋을 대상으로 연소열 값을 예측하는 능력을 평가하기 위해 XGBoost, 다층 퍼셉트론(MLP), 그래프 컨볼루션 네트워크(GCN), 신경망 컨볼루션(NNConv) 등 네 가지 머신러닝 모델을 체계적으로 비교하였습니다. 결과는 디스크립터 기반 접근법(XGBoost 및 MLP)이 더 빠른 학습 시간(약 34-60초)과 더 낮은 최종 테스트 오차(각각 2.08 및 2.31 kJ/g)를 보였으며, 특히 MLP는 가장 높은 결정 계수(R2 = 0.942)를 기록함을 보여주었습니다. 반면 그래프 기반 모델(GCN 및 NNConv)은 훨씬 긴 실행 시간(약 360-2700초)이 소요되었으나, 에폭 당 더 빠르게 수렴하고 과적합이 적으며 견고한 일반화 능력과 안정적인 오차 분포를 나타냈습니다. 잔차 및 밀도 분석에서 NNConv는 실험 값 주위에서 가장 조밀한 클러스터링을 보이며 높은 예측 충실도를 반영함을 확인했습니다. 중요하게도, 20 kJ/g 임계값을 적용한 GHS/CLP 위험 분류에서 모든 모델은 가연성 및 비가연성 화합물을 신뢰성 있게 구분하였고, 모델별 모호 영역은 경계 사례를 강조했습니다. GHS/CLP 가연성 기준에 따른 분류 오류 영향 분석 결과, NNConv가 최소한의 거짓 음성으로 전반적으로 최고의 성능을 달성함을 나타냈습니다. 이 결과는 분자 특성 예측에서 계산 효율성과 표현의 풍부함 간의 상쇄 관계를 강조하며, 디스크립터 기반과 그래프 기반 모델 모두 규제 적용을 위한 효과적인 고처리량 스크리닝 도구가 될 수 있음을 보여줍니다.

GHS/CLP 기준하의 주요 위험 지표로서 연소열 예측을 위한 딥러닝 그래프 신경망과 고전적 머신러닝 모델의 비교 평가

Key Points

Abstract

Cite This Study