Key points are not available for this paper at this time.
A Estimativa de Posição Humana (HPE) em visão computacional (CV) atraiu atenção significativa devido às suas diversas aplicações. Redes neurais convolucionais profundas (CNNs) podem ser soluções para enfrentar esse desafio, mas ainda enfrentam várias questões críticas. Muitos modelos existentes utilizam convolução em série com agrupamento, levando a saídas de baixa resolução que são subótimas para a localização precisa necessária na HPE. Eles geralmente priorizam o aprendizado de características locais, negligenciando relações contextuais cruciais entre pontos-chave. Este trabalho aborda esses desafios propondo uma nova abordagem para aprimorar a HPE. Primeiramente, o artigo avalia a rede de alta resolução (HRNet) e suas vantagens comparativas sobre outras arquiteturas de CNN. Em segundo lugar, introduz um mecanismo de atenção dupla (DSA) projetado para aumentar a consciência global do modelo, enriquecendo assim os mapas de características com informações contextuais. Em terceiro lugar, integra o mecanismo DSA na HRNet, criando a DSA-HRNet. O desempenho do modelo foi testado no conjunto de dados de validação COCO Val 2017, mostrando melhorias de 2,3% na precisão média (mAP), 3% em AP a 50 (AP50) e 2,7% em AP a 75 (AP75). Finalmente, o trabalho inclui uma investigação sobre a eficácia do mecanismo DSA dentro da estrutura HRNet, por meio de uma série de experimentos, mostrando que este trabalho oferece uma solução simplificada e eficaz para melhorar a HPE.
Kumaresan et al. (Mon,) estudaram esta questão.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: