Key points are not available for this paper at this time.
사전 훈련 데이터셋의 설계는 기초 모델의 일반성을 위한 중요한 요소로 부상하고 있습니다. 원격 감지 분야에서는 기초 모델을 사전 훈련시키기 위해 활용할 수 있는 대량의 이미지와 벤치마크 데이터셋이 존재하지만, 잘 설계된 샘플링 전략이 없는 상태에서 이러한 이미지를 사용하는 것은 비효율적이며 편향된 모델이나 일반화가 덜 된 모델을 생성할 가능성이 있습니다. 여기에서는 원격 감지 지리공간 기초 모델을 위한 사전 훈련 데이터셋의 선별 및 평가에 대한 논의와 비전을 제공합니다. 우리는 지리적, 시간적, 이미지 수집의 다양성의 중요성을 강조하고, 이러한 다양성을 전세계적으로 가능하게 하는 전략을 검토합니다. 이러한 특성 외에도 데이터셋 내 다양한 공간-시간적 사전 맥락 과제를 지원하는 것도 중요합니다. 궁극적으로 우리의 주요 목표는 기초 모델 개발 파이프라인의 데이터 선별 단계에 대한 강조와 주목을 하는 것입니다. 이를 통해 지리공간 기초 모델의 편향을 줄이고, 하류 원격 감지 작업 및 응용으로의 더 넓은 일반화를 가능하게 할 수 있다고 생각합니다.
Arndt et al. (Sun,)은 이 문제를 연구했습니다.
Synapse has enriched 3 closely related papers on similar clinical questions. Consider them for comparative context: