Key points are not available for this paper at this time.
화학 물질의 수용성을 수水에서 신뢰할 수 있고 실용적인 방법으로 결정하는 것은 여전히 경험적 관찰과 철저한 실험 연구만으로 조사되고 있다. 데이터 기반 알고리즘을 통한 화학 물질의 수용성 예측은 차세대 소재 및 화학 공식을 위한 합리적으로 설계된 효율적이고 비용 효과적인 도구를 생성할 수 있게 해준다. 우리는 8400개 이상의 화합물 데이터를 사용하여 다양한 종의 수용성을 적절히 예측하기 위한 두 가지 기계 학습(ML) 모델링 연구의 결과를 제시한다. 이전 연구에서 가장 많이 사용된 방법인 분자 기술자와 분자의 구조를 기반으로 한 원형 해시인 Morgan 지문을 적용하여 수용성 추정치를 생성하였다. 모든 모델은 랜덤 포레스트(RFs) 기법을 회귀 분석기로 사용하여 전체 데이터 세트의 80%에서 훈련하였고, 나머지 20%에서 예측 성능을 테스트하여 기술자 및 원형 지문 방법 각각에 대해 결정 계수(R2) 테스트 값은 0.88과 0.81, 루트 평균 제곱 편차(RMSE) 테스트 값은 0.64와 0.80을 얻었다. 우리는 생성된 ML 모델을 해석하고 Shapley 추가 설명(SHAP) 및 열역학적 분석을 사용하여 수용성 측정을 위한 가장 효과적인 특징을 보고하였다. 낮은 오차, 분자 수준의 상호작용 조사 능력 및 열역학적 수량과의 호환성 등으로 인해 지문 방법은 다른 이용 가능한 컴퓨터 도구에 비해 독특한 모델이 되었다. 그러나 물리 화학적 기술자 모델이 주어진 테스트 세트에 대한 더 나은 예측 정확도를 달성하는 데 지문 모델보다 우수하다는 점을 강조할 가치가 있다.
Tayyebi et al. (수요일)이 이 질문을 연구하였다.