Key points are not available for this paper at this time.
다방향 및 다국어 장면 텍스트 검출은 컴퓨터 비전 분야에서 중요한 역할을 하며, 텍스트와 배경의 다양성 때문에 도전적이다. 본 논문에서는 우선 CNN 기반 객체 검출 프레임워크를 장면 텍스트 검출에 확장할 때 두 가지 핵심 과제를 지적한다. 첫 번째 과제는 다운샘플링된 분할 기반 모듈을 통해 텍스트 영역을 국지화하는 것이며, 두 번째 과제는 첫 번째 과제에서 결정된 텍스트 영역의 경계를 회귀하는 것이다. 둘째로, 텍스트와 비텍스트 간 픽셀 단위 분류와 사각형 텍스트 경계의 꼭짓점 좌표를 픽셀 단위 회귀하는 두 가지 작업 예측 모듈을 갖는 완전 합성곱망(FCN) 기반 장면 텍스트 검출 프레임워크를 제안한다. 단어 수준 검출을 위한 후처리는 Non-Maximum Suppression (NMS) 기반이며, 문장 수준 검출을 위해 긴 텍스트 라인을 국지화하는 휴리스틱 선분 그룹화 방법을 설계하였다. 제안한 프레임워크는 다방향 및 다국어 장면 텍스트 데이터셋을 포함한 다양한 벤치마크에서 평가되었으며, 대부분에서 최신 성능을 달성하였다. 또한 고성능 CNN 기반 장면 텍스트 검출 시스템 구축에 중요한 여러 요인을 분석하기 위한 풍부한 제거 실험을 제공한다.
He 등(목,)은 이 질문을 연구하였다.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: