Key points are not available for this paper at this time.
이 연구는 대형 언어 모델(LLMs)이 자유 형식의 사용자 상호작용에서 빅 파이브 성격 특성을 추론할 수 있는 능력을 조사합니다. 결과는 GPT-4로 구동되는 챗봇이 성격을 중간 정도의 정확도로 추론할 수 있으며, 정적 텍스트 콘텐츠에서 추론을 도출하는 이전 접근법보다 성능이 우수함을 보여줍니다. 추론의 정확도는 다양한 대화 설정에 따라 달라졌습니다. 사용자의 성격 관련 정보를 유도하도록 챗봇에 요청했을 때 성능이 가장 높았으며(평균 r=.443, 범위=.245, .640), 자연스러운 상호작용을 더 중시하는 조건이 그 뒤를 이었습니다(평균 r=.218, 범위=.066, .373). 특히, 성격 평가에 직접적으로 초점을 맞추어도 사용자 경험이 덜 긍정적이지 않았으며, 참가자들은 두 조건에서 상호작용이 동일하게 자연스럽고 쾌적하며 매력적이고 인간과 유사하다고 보고했습니다. ChatGPT의 기본 행동을 모방하여 도움을 주는 조수로 작동하는 챗봇은 성격 추론에서 현저히 열악한 결과를 낳고 사용자 경험 평가도 낮았지만, 여전히 일부 성격 특성에 대한 심리적으로 의미 있는 정보를 캡처했습니다(평균 r=.117, 범위=-.004, .209). 초기 분석에 따르면 성격 추론의 정확성은 다양한 사회 인구학적 하위 그룹 간에 단지 약간의 차이를 보입니다. 우리의 결과는 대화 상호작용을 기반으로 심리적 프로파일링을 위한 LLM의 잠재력을 강조합니다. 이러한 발견과 관련된 실제적 함의와 윤리적 도전 과제에 대해 논의합니다.
Peters et al. (Mon,)은 이 질문을 연구했습니다.
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: