초록 정확한 실내 카메라 위치 추정은 증강 현실, 로봇 공학 및 자율 내비게이션 응용 프로그램에 매우 중요합니다. 6-DOF 자세 회귀를 위한 단일 이미지 딥 러닝 모델이 확립된 벤치마크에서 경쟁력 있는 결과를 보여주었지만, 이러한 모델의 개발은 여전히 광범위한 데이터 주석 및 하이퍼파라미터 조정이 필요합니다. 이 연구에서는 단일 이미지 실내 자세 회귀를 개선하기 위하여 고급 네트워크 아키텍처, 전이 학습 및 합성 데이터를 결합하는 방법을 조사합니다. 우리의 접근 방식은 Places365 데이터셋에서 사전 훈련된 ResNet50 백본을 사용하고, 이후 확립된 벤치마크에서 추가 훈련 및 평가를 수행합니다. 훈련 데이터를 보강하기 위해, 합성 이미지는 Unreal Engine을 사용하여 3D BIM 모델에서 생성되며, 정렬 절차를 통해 합성 환경과 실제 환경 간의 정확한 대응을 보장합니다. 실제 RGB 이미지는 합성 데이터의 특성을 맞추기 위해 전처리되어 효과적인 크로스 도메인 평가가 가능하도록 합니다. 실험 결과, 아키텍처 설계와 사전 훈련이 모델 성능에 상당한 영향을 미친다는 것을 보여줍니다. UniMelb 데이터셋(실제-실제 시나리오)에서 모델은 0.21 m 및 0.80° 오차를 달성하여 기준 정확도를 초과합니다. 우리는 또한 교차 검증 및 합성-합성 실험을 제공하여 성능에 영향을 주는 요인 및 아키텍처, 사전 훈련 및 데이터셋 특성 간의 상호 작용에 대한 통찰을 제공합니다.
Ryszko 외(수), 이 질문을 연구했습니다.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: