Los puntos clave no están disponibles para este artículo en este momento.
Este documento propone un método genérico para el reconocimiento de acciones en videos no controlados. La idea es utilizar imágenes recopiladas de la Web para aprender representaciones de acciones y usar este conocimiento para anotar automáticamente acciones en videos. Nuestro enfoque es no supervisado en el sentido de que no requiere intervención humana, aparte de la consulta de texto. Sus beneficios son dobles: 1) podemos mejorar la recuperación de imágenes de acción y 2) podemos recopilar una gran base de datos genérica de posturas de acción, que luego puede ser utilizada en la etiquetación de videos. Presentamos evidencia experimental de que, utilizando imágenes de acción recopiladas de la Web, es posible anotar acciones.
İkizler-Cinbiş et al. (Tue,) estudiaron esta cuestión.