Los puntos clave no están disponibles para este artículo en este momento.
La estimación de pose humana ha surgido como un problema crítico en visión por computadora debido a sus amplias aplicaciones en campos interdisciplinarios, incluida la robótica, la realidad aumentada, el análisis deportivo y la biomecánica. Los métodos tradicionales, aunque efectivos en entornos controlados, a menudo no logran generalizar a escenarios del mundo real debido a desafíos como oclusiones, variaciones de escala e inconsistencias temporales en los datos de video. Para abordar estas limitaciones, proponemos la Red de Pose Espacio-Temporal Jerárquica (HSTPN), un marco basado en aprendizaje profundo que integra la fusión de características a múltiples escalas con mecanismos de atención para capturar tanto el contexto global como los detalles finos. La Estrategia de Refinamiento Adaptativo de Pose (APRS) mejora las predicciones de pose al refinar iterativamente las ubicaciones de los puntos clave, aprovechando restricciones espaciales, temporales y específicas del dominio. Juntas, estas innovaciones permiten que nuestro enfoque logre una precisión y robustez superiores en diversos conjuntos de datos, incluidos entornos tanto restringidos como no restringidos. Los resultados experimentales demuestran que HSTPN y APRS superan a los métodos de última generación en términos de precisión de predicción, coherencia temporal y eficiencia computacional, lo que los hace bien adecuados para aplicaciones interdisciplinarias y en tiempo real en física.
Zhuo Li (Mon,) estudió esta cuestión.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: