大規模言語モデル(LLM)によって推進されたAIエージェントは、多くの人間のタスクを遂行する能力を持つようになりました。ビッグファイブ性格特性の最も標準的な定義を用いて、ゲーム理論の枠組みの中でLLMが交渉する能力を測定し、公平性とリスクの概念を測定する際の方法論的課題を探ります。単一課題および多面課題の交渉に関するシミュレーション(n=1,500)は、非対称的な課題評価によって領域の複雑性が増加することで合意率が向上する一方、攻撃的な交渉から得られる余剰は減少することを明らかにしています。勾配ブースト回帰分析とシャプレー説明法を通じて、高い開放性、誠実性、神経症傾向が公平性の傾向と関連し、低い協調性と低い開放性は合理的傾向と関連することが分かりました。低い誠実性は高い有害性と関連しています。これらの結果は、LLMが公平な行動にデフォルトする内蔵のガードレールを持っている可能性がある一方で、合意しやすい相手を利用するために「脱獄」可能であることを示しています。また、交渉ボットの設計方法に関する実用的な洞察と、ゲーム理論および計算社会科学に基づく交渉行動を評価するための枠組みを提供します。
Noh et al. (水曜日) はこの問題を研究しました。
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: