August 9, 2024Open Access

LaiDA: 데이터 증강을 통한 맥락 인식 언어학 기반의 은유 구성 요소 식별

Key Points

Key points are not available for this paper at this time.

Abstract

은유 구성 요소 식별(MCI)은 은유에 대한 기계의 이해를 향상시켜 자연어 처리 작업을 발전시키는 데 기여합니다. 그러나 복잡성, 다양성 및 맥락과 배경 지식에 대한 의존성은 MCI에 상당한 도전을 제기합니다. 대형 언어 모델(LLMs)은 강력한 의미 분석과 광범위한 상식 지식 덕분에 복잡한 자연어 텍스트를 정확하게 이해하는 새로운 길을 제공합니다. 본 연구에서는 데이터 증강을 통한 맥락 인식 언어학 기반 학습(LaiDA)이라는 새로운 LLM 기반 프레임워크를 제안합니다. 구체적으로, ChatGPT와 감독된 미세 조정을 활용하여 고품질 데이터셋을 조정합니다. LaiDA는 사전 훈련을 위해 유사어 데이터셋을 포함합니다. 그래프 주의 네트워크 인코더는 유사한 예제를 검색하기 위해 언어적으로 풍부한 특징 표현을 생성합니다. 이후, LLM은 언어적으로 유사한 예제를 통합한 프롬프트로 미세 조정됩니다. LaiDA는 NLPCC2024 공유 과제 9의 부작업 2에서 2위를 기록하며 그 효과를 입증하였습니다. 코드와 데이터는 https://github.com/WXLJZ/LaiDA에서 확인할 수 있습니다.

Read Full Paperexternally

AI에게 질문

Bookmark

View Full Paper