Key points are not available for this paper at this time.
최근 검색 보강 생성(RAG) 분야의 연구에서는 검색된 구간에서 증거를 추출하여 계산 비용을 줄이고 최종 RAG 성능을 향상시키는 방법을 조사하였지만, 여전히 도전 과제가 남아 있습니다. 기존 방법은 휴리스틱 기반 증강에 크게 의존하여 여러 가지 문제에 직면하고 있습니다: (1) 수작업으로 필터링된 맥락으로 인한 일반화 부족; (2) 규칙 기반 맥락 청킹으로 인한 의미론적 결핍; (3) 문장 단위 필터 학습으로 인한 길이 왜곡. 이러한 문제를 해결하기 위해, 우리는 자가 정렬 학습을 통해 바람직한 속성을 가진 증거 추출기로서 기본 모델을 최적화하는 모델 기반 증거 추출 학습 프레임워크인 SEER를 제안합니다. 광범위한 실험 결과, 우리의 방법이 최종 RAG 성능을 크게 향상시키고, 추출된 증거의 신뢰성, 유용성 및 간결성을 증가시키며, 증거 길이를 9.25배 줄인다는 것을 보여줍니다. 코드는 https://github.com/HITsz-TMG/SEER 에서 이용 가능합니다.
Zhao et al. (Mon,) 이 질문을 연구하였습니다.