What question did this study set out to answer?

This research aims to create a predictive framework for drug solubility in supercritical carbon dioxide to aid pharmaceutical formulation.

March 16, 2026Open Access

Accelerating supercritical pharmaceutical formulation via interpretable data-driven prediction of drug solubility

Puntos clave

This research aims to create a predictive framework for drug solubility in supercritical carbon dioxide to aid pharmaceutical formulation.
Developed multiple machine learning regressors including Extreme Gradient Boosting and Support Vector Regression.
Integrated models into an ensemble strategy for enhanced performance.
Optimized model performance using bio-inspired metaheuristic algorithms for hyperparameter selection.
Performed sensitivity and amplitude-based feature analyses to identify key factors influencing solubility.
Improved prediction accuracy for drug solubility in supercritical carbon dioxide.
Identified dominant molecular descriptors and process conditions affecting solubility.
Established a practical computational tool for accelerating pharmaceutical development processes.

Resumen

Drug solubility in supercritical carbon dioxide (SC-CO2) plays a pivotal role in the development of particle engineering, drug loading, and solvent-free pharmaceutical formulations. However, experimental solubility determination in supercritical systems remains costly, time-consuming, and compound-specific. In this study, an interpretable data-driven framework is proposed to support pharmaceutical formulation scientists by accurately predicting drug solubility in SC-CO2 while elucidating the governing physicochemical factors. Multiple machine learning regressors, including Extreme Gradient Boosting and Support Vector Regression, were developed and further integrated into an ensemble strategy to enhance robustness and generalizability. Model performance was systematically optimized using bio-inspired metaheuristic algorithms, enabling efficient hyperparameter selection across complex, nonlinear search spaces. Beyond predictive accuracy, model interpretability was emphasized through sensitivity-based and amplitude-based feature analyses, revealing the dominant molecular descriptors and process conditions influencing solubility behavior. The results demonstrate that the proposed framework not only improves solubility prediction accuracy but also provides mechanistic insights relevant to drug selection, formulation feasibility, and supercritical processing design. This work establishes a practical computational tool for accelerating pharmaceutical development pipelines involving supercritical fluid technologies.

Me gusta

Guardar

Ver artículo completo