Los puntos clave no están disponibles para este artículo en este momento.
Introducción Los trastornos emocionales y relacionados con el estrés representan una amenaza creciente para la salud mental global, lo que enfatiza la necesidad crítica de sistemas de reconocimiento de emociones precisos, robustos e interpretables. A pesar de los avances en la computación afectiva, los modelos existentes a menudo carecen de generalizabilidad en diversas bases de datos fisiológicas y conductuales, limitando su implementación práctica. Métodos Este estudio presenta un marco basado en deep learning dual para el monitoreo de la salud mental y la actividad. El primer enfoque introduce un marco para la clasificación del estrés basado en un 1D-CNN entrenado en el conjunto de datos WESAD. Este modelo se ajusta posteriormente utilizando el conjunto de datos ScientISST-MOVE para detectar actividades de la vida diaria basadas en señales de movimiento, y se utiliza como aprendizaje por transferencia para una tarea posterior. Se utiliza una técnica de IA explicativa para interpretar las predicciones del modelo, mientras que el desequilibrio de clases se aborda utilizando pérdida focal y ponderación de clases. El segundo enfoque emplea una arquitectura de conformador temporal que combina componentes de CNN y transformador para modelar dependencias temporales en las calificaciones continuas de estados emocionales basadas en valencia, excitación y dominancia (VAD) utilizando el conjunto de datos DREAMER. Este método incorpora técnicas de ingeniería de características y modela dependencias temporales en señales de ECG. Resultados El clasificador de deep learning entrenado en datos biosensoriales de WESAD logró una precisión del 98% en tres clases, demostrando una clasificación de estrés altamente confiable. El modelo de aprendizaje transferido, evaluado en el conjunto de datos ScientISST-MOVE, logró una precisión general del 82% en cuatro estados de actividad, con buena precisión y recuperación para clases de alto soporte. Sin embargo, las explicaciones producidas por Grad-CAM parecen poco informativas y no indican claramente qué partes de las señales influyen en la predicción. El modelo conformador logró una puntuación R2 de 0.78 y una precisión redondeada del 87.59% en las tres dimensiones, destacando su robustez en la predicción de emociones multidimensionales. Discusión El marco demuestra un fuerte rendimiento, interpretabilidad y aplicabilidad en tiempo real en la computación afectiva personalizada.
Almadhor et al. (Martes,) estudiaron esta cuestión.