March 3, 2026Open Access

암시적 표현과 입자 필터링 기반 포즈 세부 조정을 통한 시각적 위치 추정

Key Points

정확도는 0.09 m의 중위 평행 오류와 0.61°의 회전 오류를 달성하여 원래 HAL-NeRF와 동등합니다.
새로운 프레임워크는 다양한 조건에서 효과적인 포즈 세부 조정을 위해 몬테카를로 기법을 활용합니다.
평가는 훈련 중 가우시안 스플래팅으로 가능해진 고세부 합성 뷰 생성을 포함합니다.
기대되는 개선은 혁신적인 재샘플링 및 추정 전략을 통한 성능 향상을 강조합니다.

Abstract

본 연구에서는 물리적 포즈 회귀와 신경 장면 표현에 대한 몬테카를로 기반 세부 조정을 결합한 위치 추정 파이프라인인 HAL-NeRF v2를 제안합니다. 원래 HAL-NeRF 프레임워크를 기반으로 하는 이 시스템은 포즈 회귀기 훈련 중 빠르고 고세부 합성 뷰 생성을 위해 가우시안 스플래팅을 활용하며, 효율적인 포즈 세부 조정을 위해 NeRF를 사용합니다. 세부 조정 단계는 HAL-NeRF 단계를 대신하여 Cauchy 손실, 체계적인 재샘플링 및 최대 우도 추정을 통해 일시적 요소 및/또는 불완전한 맵핑을 가진 장면에서 수렴 안정성을 개선하도록 재설계됩니다. 또한, HAL-NeRF v2는 세부 조정 중 여러 렌더링된 뷰를 병렬로 평가하여 입자 필터가 후보 뷰포트를 신속하게 구별할 수 있도록 합니다. 캠브리지 랜드마크 데이터셋의 실험 결과는 HAL-NeRF v1과 동일한 정확도(중위 이점 0.09m / 0.61°의 평행/회전 오류)를 보이면서 실행 시간을 25배 단축하는 효과를 보여줍니다.

암시적 표현과 입자 필터링 기반 포즈 세부 조정을 통한 시각적 위치 추정

Key Points

Abstract

Cite This Study