Key points are not available for this paper at this time.
생물 의학에서 방대한 과학 문헌은 약어, 약어 및 기호의 빈번한 사용과 결합되어 텍스트 처리 및 요약에 상당한 도전을 제공합니다. 통합 의료 언어 시스템(UMLS)은 이러한 연구에서 개념을 추출하고 상관 관계를 결정하는 데 자주 사용되었습니다. 따라서 본 연구에서 소개된 BioGraphSum 모델은 이러한 UMLS 의존성을 줄이는 것을 목표로 합니다. 혁신적인 관점을 채택하여 텍스트 내 문장을 노드로 그래픽적으로 개념화하여 'Malatya 중심성'의 개념을 활용할 수 있게 합니다. 이 접근법은 그래프에서 영향력 있는 노드를 식별하고, 비유적으로 텍스트 내에서 요약에 가장 관련 있는 문장을 찾아내는 데 중점을 둡니다. BioGraphSum 접근 방식의 성능을 평가하기 위해, 검증된 연구 방법론에 따라 PubMed 데이터베이스에서 제공되는 450개의 현대 과학 연구 기사를 포함하는 말뭉치를 선별하였습니다. BioGraphSum 모델은 이 말뭉치에 대해 엄격한 테스트를 거쳐 그 능력을 입증했습니다. 특히 정밀도 기반 및 f-score 기반 ROUGE-(1-2), ROUGE-L 및 ROUGE-SU 메트릭에서 초기 결과는 텍스트 요약에서 최첨단으로 간주되는 기존의 다른 모델들과 비교했을 때 상당한 개선을 보여주었습니다.
Cengiz Hark (Mon,)가 이 질문을 연구했습니다.