Apresentamos o MOPED, uma estrutura para Estimativa e Detecção de Pose de Múltiplos Objetos que integra perfeitamente o reconhecimento de objetos em imagens únicas e múltiplas e a estimativa de pose em uma estrutura otimizada, robusta e escalável. Enfrentamos dois desafios principais em visão computacional para robótica: desempenho robusto em cenas complexas e baixa latência para operação em tempo real. Alcançamos um desempenho robusto com a Estimativa de Agrupamento Iterativa (ICE), um novo algoritmo que combina iterativamente o agrupamento de características com a estimativa de pose robusta. O agrupamento de características divide rapidamente a cena e produz hipóteses de objetos. As hipóteses são usadas para refinar ainda mais os agrupamentos de características, e os dois passos são iterados até a convergência. A ICE é fácil de paralelizar e integra facilmente o reconhecimento de objetos em uma e várias câmeras e a estimativa de pose. Também introduzimos uma nova função de pontuação para hipóteses de objetos baseada na teoria do M-estimador e um novo algoritmo de agrupamento de pose que lida robustamente com outliers de reconhecimento. Alcançamos escalabilidade e baixa latência com um algoritmo de correspondência de características melhorado para grandes bancos de dados, uma arquitetura híbrida GPU/CPU que explora o paralelismo em todos os níveis e um agendador de recursos otimizado. Fornecemos extensos resultados experimentais demonstrando desempenho de ponta em termos de reconhecimento, escalabilidade e latência em aplicações robóticas do mundo real.
Collet et al. (Sex,) estudaram esta questão.