ToM: 텍스트 중심의 키포인트 캡처를 통한 TextVQA 향상 | Synapse