Los puntos clave no están disponibles para este artículo en este momento.
Cada vez más, las máquinas interactúan con las personas a través del reconocimiento de acciones humanas a partir de flujos de video. Los datos de video pueden representarse de forma natural como un tensor de datos de tercer orden. Aunque se han propuesto muchos enfoques basados en tensores para el reconocimiento de acciones, la geometría del espacio tensorial rara vez se considera un aspecto importante. En este documento, enfatizamos que un tensor de datos está relacionado con un paquete tangente en una variedad especial. Utilizando un mapeo de variedades, podemos extraer información discriminante entre acciones. Los tensores de datos se factorizan primero utilizando descomposición en valores singulares de alto orden, donde cada factor se proyecta sobre un espacio tangente y se calcula la distancia intrínseca desde un paquete tangente para la clasificación de acciones. Examinamos un mapeo de variedades estándar y algunos mapeos alternativos en variedades especiales, en particular, el grupo ortogonal especial, variedades de Stiefel y variedades de Grassmann. Debido a que el paradigma propuesto enmarca el esquema de clasificación como un vecino más cercano basado en la distancia intrínseca, no es necesario un entrenamiento previo. Evaluamos nuestro método en tres bases de datos públicas de acciones, incluyendo el gesto de Cambridge, el gesto corporal UMD Keck y los conjuntos de datos de deportes de UCF. Los resultados empíricos revelan que nuestro método es altamente competitivo con los métodos actuales de vanguardia, robusto a pequeños errores de alineación y, sin embargo, más simple.
Yui Man Lui (Fri,) estudió esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: