What question did this study set out to answer?

이 작업은 고급 네트워크 아키텍처와 합성 데이터를 결합하여 단일 이미지 실내 위치 추정을 개선하는 것을 목표로 합니다.

May 9, 2026Open Access

BIM 모델에서의 크로스 도메인 학습을 이용한 단일 이미지 실내 위치 추정

Key Points

이 작업은 고급 네트워크 아키텍처와 합성 데이터를 결합하여 단일 이미지 실내 위치 추정을 개선하는 것을 목표로 합니다.
자세 회귀를 위해 Places365 데이터셋에서 사전 훈련된 ResNet50 백본을 사용했습니다.
훈련을 위해 Unreal Engine을 사용하여 3D BIM 모델에서 합성 이미지를 생성했습니다.
효과적인 평가를 위해 합성 데이터의 특성을 맞출 수 있도록 실제 RGB 이미지를 전처리했습니다.
모델은 UniMelb 데이터셋에서 0.21 m 및 0.80° 오차를 달성하여 기준 정확도를 초과했습니다.
발견된 결과는 아키텍처 설계와 사전 훈련이 모델 성능에 중요한 영향을 미친다는 것을 보여줍니다.

Abstract

초록 정확한 실내 카메라 위치 추정은 증강 현실, 로봇 공학 및 자율 내비게이션 응용 프로그램에 매우 중요합니다. 6-DOF 자세 회귀를 위한 단일 이미지 딥 러닝 모델이 확립된 벤치마크에서 경쟁력 있는 결과를 보여주었지만, 이러한 모델의 개발은 여전히 광범위한 데이터 주석 및 하이퍼파라미터 조정이 필요합니다. 이 연구에서는 단일 이미지 실내 자세 회귀를 개선하기 위하여 고급 네트워크 아키텍처, 전이 학습 및 합성 데이터를 결합하는 방법을 조사합니다. 우리의 접근 방식은 Places365 데이터셋에서 사전 훈련된 ResNet50 백본을 사용하고, 이후 확립된 벤치마크에서 추가 훈련 및 평가를 수행합니다. 훈련 데이터를 보강하기 위해, 합성 이미지는 Unreal Engine을 사용하여 3D BIM 모델에서 생성되며, 정렬 절차를 통해 합성 환경과 실제 환경 간의 정확한 대응을 보장합니다. 실제 RGB 이미지는 합성 데이터의 특성을 맞추기 위해 전처리되어 효과적인 크로스 도메인 평가가 가능하도록 합니다. 실험 결과, 아키텍처 설계와 사전 훈련이 모델 성능에 상당한 영향을 미친다는 것을 보여줍니다. UniMelb 데이터셋(실제-실제 시나리오)에서 모델은 0.21 m 및 0.80° 오차를 달성하여 기준 정확도를 초과합니다. 우리는 또한 교차 검증 및 합성-합성 실험을 제공하여 성능에 영향을 주는 요인 및 아키텍처, 사전 훈련 및 데이터셋 특성 간의 상호 작용에 대한 통찰을 제공합니다.

Bookmark

View Full Paper