April 30, 2024Open Access

LITO: 진실성 최적화를 위한 학습 가능한介入

Key Points

Key points are not available for this paper at this time.

Abstract

대형 언어 모델(LLMs)은 장편의 일관된 텍스트를 생성할 수 있지만, 여전히 사실을 환상적으로 만들고 있어 신뢰성을 제한합니다. 이 문제를 해결하기 위해, 진실한 응답을 이끌어내는 추론 시점 방법이 학습된 "진실한 방향"으로 LLM 표현을 전환하는 방식으로 제안되었습니다. 그러나 동일한 강도로 진실한 방향을 적용하는 것은 다양한 질문 맥락에서 일반화되지 못합니다. 우리는 특정 맥락에 맞는 최적의介入 강도를 자동으로 식별하는 진실성 최적화를 위한 학습 가능한介入 방법인 LITO를 제안합니다. LITO는介入 강도의 증가 수준에 따라 모델 생성의 시퀀스를 탐색합니다. 가장 정확한 응답을 선택하거나 예측이 매우 불확실할 때는 답변을 거부합니다. 여러 LLM 및 질문-응답 데이터셋에 대한 실험 결과, LITO는 작업 정확성을 유지하면서 진실성을 개선하는 것을 보여줍니다. LITO의 적응형 특성은 일률적인介入 기반 솔루션의 문제를 해결하며, 모델이 확신할 때만 내부 지식을 반영하여 모델의 진실성을 극대화합니다.

LITO: 진실성 최적화를 위한 학습 가능한介入

Key Points

Abstract

Cite This Study

Also Consider

Also Consider