본 연구에서는 물리적 포즈 회귀와 신경 장면 표현에 대한 몬테카를로 기반 세부 조정을 결합한 위치 추정 파이프라인인 HAL-NeRF v2를 제안합니다. 원래 HAL-NeRF 프레임워크를 기반으로 하는 이 시스템은 포즈 회귀기 훈련 중 빠르고 고세부 합성 뷰 생성을 위해 가우시안 스플래팅을 활용하며, 효율적인 포즈 세부 조정을 위해 NeRF를 사용합니다. 세부 조정 단계는 HAL-NeRF 단계를 대신하여 Cauchy 손실, 체계적인 재샘플링 및 최대 우도 추정을 통해 일시적 요소 및/또는 불완전한 맵핑을 가진 장면에서 수렴 안정성을 개선하도록 재설계됩니다. 또한, HAL-NeRF v2는 세부 조정 중 여러 렌더링된 뷰를 병렬로 평가하여 입자 필터가 후보 뷰포트를 신속하게 구별할 수 있도록 합니다. 캠브리지 랜드마크 데이터셋의 실험 결과는 HAL-NeRF v1과 동일한 정확도(중위 이점 0.09m / 0.61°의 평행/회전 오류)를 보이면서 실행 시간을 25배 단축하는 효과를 보여줍니다.
Cheimariotis 외 (Thu,) 이 질문을 연구했습니다.