본 연구는 대형 언어 모델(LLMs)의 출력에 추론을 통합하는 접근 방식—논리적 추론 기법과 지식 검색을 결합하여—진실과의 정합성을 향상시키는 것을 조사합니다. 우리는 먼저 진정한 의미 이해 없이 마르코프 가정에 기반하여 확률적 텍스트 생성기로 작동하는 LLM의 통계적 기초를 분석합니다. 다음으로 AI 맥락에서 '진실'의 개념적 틀을 논의하며, 서술적 진실(객관적 정확성), 실용적 진실(맥락적 유용성), 그리고 검증 가능한 지식(독립적인 증거로 뒷받침된 정보)의 차이를 구분합니다. 우리는 LLM을 인증된 지식에 더 가깝게 만들고 환각 경향을 완화하는 고급 추론 기법—Chain-of-Thought 1, Tree-of-Thought 2, Retrieval-Augmented Generation 3, 그리고 CriticGPT 4와 같은 자가 비판 모델—을 살펴봅니다. 이 논문은 또한 철학적 함의를 탐구합니다: 추론 능력을 갖춘 현대의 LLM은 오류 수정과 학습 능력이 있는 인간과 유사한 '실수하기 쉬운 인지 에이전트'로 간주될 수 있는가? 아니면 단지 진정한 이해 없이 언어를 모방하는 확률적 앵무새에 불과한가? 마지막으로, 우리는 추론 통합 AI 시스템을 배치하는 데 관련된 위험, 한계 및 윤리적 문제에 대한 논의를 열고, 이를 인공지능 평가에 있어 실용주의, 반실재론 및 행동주의 관점과 같은 현대 철학적 흐름과 연결합니다.
Xuan 외. (토요일,) 이 질문을 연구했습니다.