La adición de rasgos genéticos de especies en modelos QSAR mejora las predicciones de toxicidad inter-especies. Basándonos en esta idea, desarrollamos un modelo Bio-QSAR que interpreta la similitud genética como un proxy para las respuestas fisiológicas comunes e integra características químicas y genéticas dentro de un modelo de red neuronal. La principal ventaja es que la representación de las especies es continua y, por lo tanto, permite un mayor grado de generalización que las categorías basadas en la taxonomía, mejorando las predicciones para nuevas especies no probadas. Realizamos un análisis comparativo del rendimiento de nuestro modelo frente al de modelos Bio-QSAR recientemente publicados. Los resultados indicaron que nuestro modelo logró un nivel de precisión predictiva similar, demostrando su competitividad dentro de las metodologías actuales de vanguardia. En lugar de seleccionar el modelo de mejor rendimiento como el buque insignia, optamos por presentar la distribución de métricas de rendimiento junto con su promedio a través de la validación cruzada repetida. Además, reportamos el rango de estas métricas para facilitar comparaciones con otros modelos. Finalmente, analizamos las salidas del modelo para identificar posibles sesgos de muestreo en los conjuntos de datos, destacando extremos para la respuesta tóxica de especies y químicos. Nuestros resultados demostraron que esta representación de especies es un enfoque altamente efectivo para escenarios de extrapolación en conjuntos de datos ecotoxicológicos comunes con alta escasez de datos. En su estado actual, este modelo puede ser utilizado para llenar vacíos en conjuntos de datos o mejorar la evaluación de riesgos ambientales con más datos, y priorizar directamente nuevas pruebas para diferentes especies o químicos. Estas mejoras futuras permitirán predicciones más precisas sobre especies completamente nuevas, ya sean especies criadas en laboratorio, raras o indígenas. • Los conjuntos de datos ecotoxicológicos son escasos, muchos efectos químicos sobre especies no han sido probados. • Los modelos categóricos no son flexibles para categorías fuera del conjunto de entrenamiento. • Usar una representación continua de especies permite la extrapolación sobre nuevas especies. • Combinar características de similitud entre especies y químicos proporciona un marco robusto del modelo. • La similitud genética en modelos QSAR proporciona buenas predicciones fuera del conjunto de entrenamiento.
Building similarity graph...
Analyzing shared references across papers
Loading...
Ecotoxicology and Environmental Safety
Radboud University Nijmegen
Leiden University
National Institute for Public Health and the Environment
Add This Paper to Your Research Feed
Any time a new paper drops it will be there.
Forastiere et al. (Mon,) estudiaron esta cuestión.