Key points are not available for this paper at this time.
컴퓨터 비전 분야에서는 자연 장면 이미지(NSI-SOD)에서 두드러진 객체 탐지에 대한 큰 발전이 있었으나, 광학 원격 감지 이미지(RSI-SOD)에서의 두드러진 객체 탐지는 여전히 도전적인 주제로 남아 있습니다. 광학 RSI의 고유한 특성인 규모, 조명, 이미징 방향 등이 NSI-SOD와 RSI-SOD 간의 중요한 차이를 가져옵니다. 본 논문에서는 RSI-SOD를 위한 다중 콘텐츠 보완 네트워크(MCCNet)를 제안하여 다중 콘텐츠의 보완성을 탐구합니다. 특히, MCCNet은 일반적인 인코더-디코더 아키텍처를 기반으로 하며, 인코더와 디코더를 연결하는 새로운 핵심 구성 요소인 다중 콘텐츠 보완 모듈(MCCM)을 포함합니다. MCCM에서는 전경 특징, 엣지 특징, 배경 특징 및 글로벌 이미지 수준 특징을 포함하여 RSI-SOD에 중요한 여러 종류의 특징을 고려하고, 이를 통해 다양한 규모의 RSI 특징에서 두드러진 영역을 강조합니다. 또한, 학습 단계에서 픽셀 수준, 맵 수준 및 메트릭 인식 손실을 포괄적으로 도입합니다. 두 개의 인기 있는 데이터셋에서의 광범위한 실험 결과, 제안된 MCCNet이 23개의 최첨단 방법(NSI-SOD 및 RSI-SOD 방법 모두 포함)을 초월하는 것을 보여줍니다. 우리의 방법에 대한 코드 및 결과는 https://github.com/MathLee/MCCNet 에서 확인할 수 있습니다.
Li et al. (Tue,)는 이 질문을 연구하였습니다.