May 30, 2024Open Access

PDDLEGO: テキスト環境における反復計画

Key Points

Key points are not available for this paper at this time.

Abstract

テキスト環境における計画は、現在のモデルにとっても長年の課題であることが示されています。最近の有望な研究では、LLMを用いて環境の形式的表現を生成し、それをシンボリックプランナーが解決できるようにしています。しかし、既存の方法はすべてのエンティティの状態が最初に知られている完全に観察された環境に依存しているため、一度だけの表現を構築することができ、完全な計画につながります。対照的に、我々は最初に最終目標の計画に必要な十分な情報がない部分的に観察された環境に取り組みます。我々は、与えられたサブゴールに対する部分的な計画につながる計画表現を反復的に構築するPDDLEGOを提案します。サブゴールを達成することで、表現を強化するためのより多くの情報が得られ、最終目標を達成します。我々は、少数ショットのPDDLEGOによって生成された計画が、Coin Collectorシミュレーションでエンドツーエンドに計画を生成するよりも43%効率的であり、エンドツーエンドのLLMが一貫した計画を生成できないさらに複雑なCooking Worldシミュレーションでは強力なパフォーマンス（98%）を示すことを示します（4％）。

Read Full Paperexternally

AIに質問

Bookmark

View Full Paper