Key points are not available for this paper at this time.
최근 여러 공간-시간 메모리 기반 네트워크가 과거 프레임에서의 객체 단서(예: 비디오 프레임 및 분할된 객체 마스크)가 현재 프레임에서 객체를 분할하는 데 유용하다는 것을 보였습니다. 그러나 이러한 방법은 현재와 과거 프레임 간의 전역-전역 매칭을 통해 메모리 정보를 활용하여 유사한 객체에 대한 불일치 및 높은 계산 복잡성을 초래합니다. 이러한 문제를 해결하기 위해, 우리는 반지도 학습 VOS를 위한 새로운 지역-지역 매칭 솔루션인 지역 메모리 네트워크(RMNet)를 제안합니다. RMNet에서는 목표 객체가 과거 프레임에서 나타나는 지역을 기억하여 정밀한 지역 메모리를 구성합니다. 현재 쿼리 프레임의 경우, 쿼리 지역은 이전 프레임에서 추정된 광학 플로우를 기반으로 추적 및 예측됩니다. 제안된 지역-지역 매칭은 메모리와 쿼리 프레임 모두에서 유사한 객체의 모호성을 효과적으로 완화하여 정보를 지역 메모리에서 쿼리 영역으로 효율적이고 효과적으로 전달할 수 있게 합니다. 실험 결과에 따르면, 제안된 RM-Net은 DAVIS 및 YouTube-VOS 데이터셋에서 최첨단 방법에 비해 우수한 성능을 보입니다.
Xie et al. (Tue,)는 이 질문을 연구했습니다.