November 30, 2021Open Access

광학 원격 감지 이미지에서 두드러진 객체 탐지를 위한 다중 콘텐츠 보완 네트워크

Key Points

Key points are not available for this paper at this time.

Abstract

컴퓨터 비전 분야에서는 자연 장면 이미지(NSI-SOD)에서 두드러진 객체 탐지에 대한 큰 발전이 있었으나, 광학 원격 감지 이미지(RSI-SOD)에서의 두드러진 객체 탐지는 여전히 도전적인 주제로 남아 있습니다. 광학 RSI의 고유한 특성인 규모, 조명, 이미징 방향 등이 NSI-SOD와 RSI-SOD 간의 중요한 차이를 가져옵니다. 본 논문에서는 RSI-SOD를 위한 다중 콘텐츠 보완 네트워크(MCCNet)를 제안하여 다중 콘텐츠의 보완성을 탐구합니다. 특히, MCCNet은 일반적인 인코더-디코더 아키텍처를 기반으로 하며, 인코더와 디코더를 연결하는 새로운 핵심 구성 요소인 다중 콘텐츠 보완 모듈(MCCM)을 포함합니다. MCCM에서는 전경 특징, 엣지 특징, 배경 특징 및 글로벌 이미지 수준 특징을 포함하여 RSI-SOD에 중요한 여러 종류의 특징을 고려하고, 이를 통해 다양한 규모의 RSI 특징에서 두드러진 영역을 강조합니다. 또한, 학습 단계에서 픽셀 수준, 맵 수준 및 메트릭 인식 손실을 포괄적으로 도입합니다. 두 개의 인기 있는 데이터셋에서의 광범위한 실험 결과, 제안된 MCCNet이 23개의 최첨단 방법(NSI-SOD 및 RSI-SOD 방법 모두 포함)을 초월하는 것을 보여줍니다. 우리의 방법에 대한 코드 및 결과는 https://github.com/MathLee/MCCNet 에서 확인할 수 있습니다.

Bookmark

View Full Paper

Bookmark

View Full Paper

광학 원격 감지 이미지에서 두드러진 객체 탐지를 위한 다중 콘텐츠 보완 네트워크

Key Points

Abstract

Cite This Study