Los puntos clave no están disponibles para este artículo en este momento.
El objetivo de este estudio es analizar comparativamente el rendimiento de algoritmos de aprendizaje automático (ML) para modelar la salinidad del suelo utilizando datos de conductividad eléctrica (EC) basados en campo e imágenes satelitales de Landsat-8 OLI con covariables ambientales derivadas. También buscamos interpretar y explicar los modelos de ML con y sin métodos de sobremuestreo utilizando valores de Shapley (SHAP), un enfoque de ML explicativo que aún no se ha utilizado para tareas de estimación de salinidad del suelo como un problema de ML. Investigamos dos áreas de estudio de caso de las Playas del Lago Urmia (LUP) en el noroeste de Irán. Nuestro estudio utiliza 26 covariables ambientales, dos modelos de ML, a saber, extreme gradient boosting (XGBoost) y random forest (RF), y dos métodos de sobremuestreo: técnica de sobremuestreo sintético de minorías (SMOTE) y sobremuestreo aleatorio (ROS). Los resultados indican que XGBoost tiene un rendimiento superior en comparación con RF en términos de R2 y RMSE. Además, la interpretación visual de los mapas de salinidad del suelo demostró la superioridad de XGBoost. SMOTE produjo resultados superiores a ROS y a los casos de prueba sin sobremuestreo. Finalmente, el análisis SHAP ilustró que los índices de vegetación hicieron una mayor contribución a la predicción de la salinidad del suelo en el West LUP, mientras que las bandas visibles contribuyeron más en la región Southeast LUP.
Aksoy et al. (Fri,) estudiaron esta cuestión.