Key points are not available for this paper at this time.
이 논문은 의료 분야(유방암 환자의 X-레이 보고서)의 자연어 텍스트 집합에 대한 분석 및 처리 프로그램을 설명합니다. 이 프로그램은 텍스트의 정보를 추가적인 자동 정보 처리(예: 기록 편집, 수집된 데이터에 대한 질문 응답 또는 데이터의 통계 요약)에 적합한 표 형식으로 변환합니다. 데이터를 위한 적절한 표 형식을 설정하기 위해, 처음에는 텍스트 샘플에 대해 수동 언어 분석을 수행합니다. 이를 통해 이 유형의 자료에 대한 단어 클래스와 표 형식(정보 형식이라고 함)을 얻습니다. 그런 다음 일련의 처리 프로그램을 텍스트의 문장에 적용합니다. 각 문장은 문법 구조를 얻기 위해 Linguistic String Parser 영어 문법으로 구문 분석되며, 특정 표준 영어가 문장의 문법적 형식을 규칙화하는 데 적용됩니다. 마지막으로 일련의 서식 변환이 문장의 단어를 형식 또는 표의 슬롯에 매핑하여 문장이 표에서의 표현으로부터 재구성 가능하도록 만듭니다(동의어 수준까지). 이러한 프로그램을 말뭉치에 적용한 결과가 설명됩니다. 이 절차를 통해 우리는 자연어 말뭉치를 구조화된 데이터베이스로 변환할 수 있습니다.
Hirschman et al. (Thu,)은 이 질문을 연구했습니다.