Key points are not available for this paper at this time.
대규모 언어 모델(LLM)은 작업 학습을 위한 지식 출처로서 상당한 가능성을 제공합니다. 프롬프트 엔지니어링은 LLM에서 지식을 이끌어내는 데 효과적이라는 것이 입증되었으나, 이는 독립적으로 구체적인 상황에 맞는 지식을 획득하기에는 부족합니다. 우리는 STARS라는 인지 에이전트 접근 방식을 설명하며, 이는 프롬프트 엔지니어링을 확장하고 보완하여 제약을 완화하고, 에이전트가 고유한 언어 능력, 구현, 환경 및 사용자 선호도에 맞는 새로운 작업 지식을 습득할 수 있도록 합니다. STARS 접근 방식은 LLM의 응답 영역을 증가시키고, 자율 에이전트 내에 내장된 일반 전략을 배치하여 LLM에 의해 생성된 후보 응답을 평가, 수정 및 선택하는 것입니다. 우리는 LLM으로부터 다양한 응답을 검색하고 평가함으로써 에이전트가 사용자 감독 없이 원샷 학습에서 77-94%의 작업 완료를 달성할 수 있는 방법을 보여주는 접근 방식과 실험을 설명합니다. 이 접근 방식은 사람의 감독(예: 선호도 표시)이 제공될 때 100%의 작업 완료를 달성합니다. 더욱이 감독의 유형은 대체로 명시적인 자연어 지시에서 에이전트에 의해 검토된 고품질 응답에 대한 간단한 확인/부정으로 이동합니다.
Kirk et al. (Sun,)은 이 질문을 연구했습니다.