October 1, 2019

픽셀 집계 네트워크를 이용한 효율적이고 정확한 임의 형태의 텍스트 탐지

Key Points

Key points are not available for this paper at this time.

Abstract

장면 텍스트 탐지, 즉 장면 텍스트 읽기 시스템의 중요한 단계는 합성곱 신경망을 통해 빠르게 발전해왔습니다. 그럼에도 불구하고 두 가지 주요 과제가 여전히 존재하며, 실제 응용으로의 배포를 방해하고 있습니다. 첫 번째 문제는 속도와 정확성 간의 균형입니다. 두 번째 문제는 임의 형태의 텍스트 인스턴스를 모델링하는 것입니다. 최근 몇 가지 방법이 임의 형태의 텍스트 탐지를 해결하기 위해 제안되었지만, 전체 파이프라인의 속도를 고려하는 경우는 드물어 실제 응용에서 부족할 수 있습니다. 본 논문에서는 효율적이고 정확한 임의 형태 텍스트 탐지기인 픽셀 집계 네트워크(PAN)를 제안합니다. 이는 낮은 계산 비용의 세분화 헤드와 학습 가능한 후처리를 갖추고 있습니다. 보다 구체적으로, 세분화 헤드는 기능 피라미드 강화 모듈(FPEM)과 기능 융합 모듈(FFM)으로 구성됩니다. FPEM은 멀티 레벨 정보를 도입하여 더 나은 세분화를 유도할 수 있는 캐스케이드형 U자형 모듈입니다. FFM은 서로 다른 깊이의 FPEM에서 제공된 기능을 집계하여 최종 세분화 기능을 생성할 수 있습니다. 학습 가능한 후처리는 예측 유사성 벡터에 의해 텍스트 픽셀을 정확하게 집계할 수 있는 픽셀 집계(PA)로 구현됩니다. 여러 표준 벤치마크에서의 실험 결과, 제안된 PAN의 우수성이 입증되었습니다. 본 방법은 CTW1500에서 84.2 FPS로 79.9%의 경쟁력 있는 F-측정을 달성할 수 있다는 점이 주목할 만합니다.

AI에게 질문

Bookmark

AI에게 질문

Bookmark

픽셀 집계 네트워크를 이용한 효율적이고 정확한 임의 형태의 텍스트 탐지

Key Points

Abstract

Cite This Study