April 17, 2025Open Access

VMKLA-UNet: KAN 선형 주의 U-Net을 갖춘 비전 맘바

Key Points

Key points are not available for this paper at this time.

Abstract

의료 영상 분할 분야에서, 합성곱 신경망(CNN)과 Transformer 기반 아키텍처가 눈에 띄는 성공을 거두었으나 여전히 상당한 도전에 직면해 있습니다. CNN은 장거리를 의존성을 포착하는 능력이 제한적인 경우가 많으며, Transformer 모델은 종종 높은 계산 오버헤드에 제약을 받습니다. 최근 비전 맘바 모델과 KAN 선형 주의가 결합된 형태가 매우 유망한 대안으로 등장했습니다. 본 연구에서는 VMKLA-UNet이라는 의료 이미지 분할을 위한 새로운 모델을 제안합니다. 이 아키텍처의 인코더는 전역 시각 맥락 모델링 및 위치 임베딩을 위한 양방향 상태공간 모델을 사용하는 VMamba 프레임워크를 활용하여 효율적인 특징 추출 및 표현 학습을 가능하게 합니다. 디코더를 위해 우리는 Mamba 프레임워크에 뿌리를 둔 KAN 선형 주의와 함께 채널-공간 주의 메커니즘을 통합한 MKCSA 아키텍처를 도입합니다. KAN 선형 주의는 계산 복잡성을 상당히 감소시키면서도 모델이 관심 있는 중요한 영역에 집중할 수 있는 능력을 향상시켜 효율적인 글로벌 맥락 이해를 촉진합니다. 채널 주의 메커니즘은 각 특징 채널의 중요성을 동적으로 조절하여 주요 특징을 강조하고 다양한 조직 유형 또는 병변 영역을 구분하는 모델의 능력을 강화합니다. 동시에, 공간 주의 메커니즘은 이미지 내 주요 영역에 대한 모델의 초점을 다듬어 분할 경계 정확도와 세부 사항 해상도를 향상시킵니다. 채널과 공간 주의 메커니즘의 시너지적 통합은 모델의 적응력을 증대시켜 다양한 병변 유형에 걸쳐 우수한 분할 성능을 이끌어냅니다. Polyp, ISIC 2017, ISIC 2018, PH2, Synapse를 포함한 공개 데이터셋에 대한 광범위한 실험 결과, VMKLA-UNet은 일관되게 높은 분할 정확도와 강인성을 달성하여 의료 이미지 분할 작업을 위한 매우 효과적인 솔루션으로 자리 잡고 있습니다.

AI에게 질문

Bookmark

View Full Paper