Key points are not available for this paper at this time.
テキスト環境における計画は、現在のモデルにとっても長年の課題であることが示されています。最近の有望な研究では、LLMを用いて環境の形式的表現を生成し、それをシンボリックプランナーが解決できるようにしています。しかし、既存の方法はすべてのエンティティの状態が最初に知られている完全に観察された環境に依存しているため、一度だけの表現を構築することができ、完全な計画につながります。対照的に、我々は最初に最終目標の計画に必要な十分な情報がない部分的に観察された環境に取り組みます。我々は、与えられたサブゴールに対する部分的な計画につながる計画表現を反復的に構築するPDDLEGOを提案します。サブゴールを達成することで、表現を強化するためのより多くの情報が得られ、最終目標を達成します。我々は、少数ショットのPDDLEGOによって生成された計画が、Coin Collectorシミュレーションでエンドツーエンドに計画を生成するよりも43%効率的であり、エンドツーエンドのLLMが一貫した計画を生成できないさらに複雑なCooking Worldシミュレーションでは強力なパフォーマンス(98%)を示すことを示します(4%)。
Zhang et al. (Thu,) はこの問題を研究しました。
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: