Los puntos clave no están disponibles para este artículo en este momento.
Este documento responde al desafío MIA-COV19 para clasificar COVID de no COVID basándose en imágenes de TC de pulmones. El virus COVID-19 ha devastado el mundo en los últimos dieciocho meses, infectando a más de 182 millones de personas y causando más de 3.9 millones de muertes. El objetivo principal es predecir el diagnóstico del virus COVID-19 a partir de radiografías de tórax, a través del desarrollo de técnicas de aprendizaje profundo de transformadores de visión explicables, lo que lleva a un cribado poblacional de manera más rápida, precisa y transparente. En esta competición, hay un total de 5381 conjuntos de datos tridimensionales (3D), incluidos 1552 para entrenamiento, 374 para evaluación y 3455 para pruebas. Aunque la mayoría de los volúmenes de datos están en vista axial, hay una cantidad de datos de sujetos en vistas coronales o sagitales, con 1 o 2 cortes en vista axial. Por lo tanto, mientras se investiga la clasificación basada en datos 3D, en esta competición, las imágenes 2D siguen siendo el foco principal. Se estudian dos métodos de aprendizaje profundo, que son el transformador de visión (ViT) basado en modelos de atención y DenseNet que se construye sobre redes neuronales convolucionales convencionales (CNN). Los resultados iniciales de evaluación basados en conjuntos de datos de validación donde se conoce la verdad de base indican que ViT tiene un mejor rendimiento que DenseNet con puntuaciones F1 de 0.76 y 0.72 respectivamente. Los códigos están disponibles en GitHub en.
Gao et al. (Sun,) estudiaron esta cuestión.