최근 대형 언어 모델(LLM)의 한계를 극복하기 위해 검색 기반 생성(RAG; Retrieval-Augmented Generation) 기법이 활발히 연구되고 있다. 본 연구에서는 기존의 반복적 검색-생성 기법인 ITER-RETGEN을 기반으로, 두 가지 개선점을 적용한 효과적인 RAG 방법을 제안한다. 첫째, 반복 횟수를 고정하지 않고, 반복 과정에서 유사한 문서가 지속적으로 검색될 경우 반복을 조기 종료함으로써 연산 비용을 절감한다. 둘째, 모델의 생성 결과를 활용하여 질의를 정제(Query Refinement)함으로써 검색 성능을 향상시킨다. 제안하는 방법은 다중 추론이 필요한 질의에서도 높은 정답률을 유지하면서, 불필요한 반복을 줄여 효율성을 개선하였다. HotPotQA, MuSiQue 등 다양한 공개 데이터셋에 대해 실험을 수행하였으며, 평균 반복 횟수를 최대 17% 가량 절감하면서도, 정답률은 최대 5%p 가량 향상됨을 확인하였다.
Kim et al. (Thu,) studied this question.