Los puntos clave no están disponibles para este artículo en este momento.
La adopción generalizada de vehículos autónomos comerciales (AV) y sistemas avanzados de asistencia al conductor (ADAS) puede depender en gran medida de su aceptación por parte de la sociedad, para lo cual su percepción de confiabilidad e interpretabilidad para los pasajeros es crucial. En general, esta tarea es desafiante porque el software de los sistemas autónomos modernos depende en gran medida de modelos de inteligencia artificial de caja negra. Con este objetivo, este artículo presenta un nuevo conjunto de datos, Rank2Tell 1, un conjunto de datos egocéntrico multimodal para clasificar el nivel de importancia y contar la razón de la importancia. Usando diversas preguntas visuales abiertas y cerradas, el conjunto de datos proporciona anotaciones densas de varios atributos semánticos, espaciales, temporales y relacionales de diversos objetos importantes en escenarios de tráfico complejos. Las anotaciones densas y los atributos únicos del conjunto de datos lo convierten en un recurso valioso para los investigadores que trabajan en la comprensión de escenas visuales y campos relacionados. Además, introducimos un modelo conjunto para la clasificación conjunta del nivel de importancia y la generación de subtítulos en lenguaje natural para evaluar nuestro conjunto de datos y demostrar el rendimiento con evaluaciones cuantitativas.
Sachdeva et al. (Wed,) estudiaron esta cuestión.