Los puntos clave no están disponibles para este artículo en este momento.
La respuesta a preguntas visuales médicas (Med-VQA) tiene un enorme potencial en la atención médica. Sin embargo, el desarrollo de esta tecnología se ve obstaculizado por la falta de conjuntos de datos etiquetados de calidad y disponibles públicamente para el entrenamiento y la evaluación. En este documento, presentamos un gran conjunto de datos bilingüe, SLAKE, con etiquetas semánticas completas anotadas por médicos experimentados y una nueva base de conocimiento médico estructural para Med-VQA. Además, SLAKE incluye modalidades más ricas y cubre más partes del cuerpo humano que el conjunto de datos actualmente disponible. Mostramos que SLAKE puede ser utilizado para facilitar el desarrollo y la evaluación de sistemas Med-VQA. El conjunto de datos se puede descargar de http://www.med-vqa.com/slake.
Liu et al. (Tue,) estudiaron esta cuestión.