Los puntos clave no están disponibles para este artículo en este momento.
En este documento, proponemos un nuevo enfoque para emparejar imágenes observadas desde diferentes vistas de cámara con transformaciones complejas entre vistas y lo aplicamos a la re-identificación de personas. Separa conjuntamente los espacios de imagen de dos vistas de cámara en diferentes configuraciones de acuerdo con la similitud de las transformaciones entre vistas. Las características visuales de un par de imágenes de diferentes vistas se alinean localmente proyectándolas a un espacio de características común y luego se emparejan con métricas suavemente asignadas que son optimizadas localmente. Las características óptimas para reconocer identidades son diferentes de aquellas para agrupar transformaciones entre vistas. Se aprenden conjuntamente utilizando normas que inducen escasez y regularización teórica de la información. Este enfoque se puede generalizar a los entornos donde las imágenes de prueba provienen de nuevas vistas de cámara, no las mismas que las del conjunto de entrenamiento. Se realizan extensos experimentos en conjuntos de datos públicos y en nuestro propio conjunto de datos. Las comparaciones con los métodos de aprendizaje de métricas de última generación y de re-identificación de personas muestran el rendimiento superior de nuestro enfoque.
Li et al. (Sáb,) estudiaron esta cuestión.