Key points are not available for this paper at this time.
本論文では、具現化AIにおける最近の発展に関する体系的レビューおよび技術的再検討を行います。我々は、現在の主流パラダイム、代表的なアーキテクチャ、および重要な進展を、次の五つのコアモジュールに沿って包括的に統合します:(1) 知覚と理解、(2) 推論と意思決定、(3) 制御と行動、(4) モデリングと学習(例:VLA(視覚-言語-行動)およびWM(世界モデル))、および(5) データとシミュレーション。この分析は、具現化AI技術の構造化された最先端の全体像を確立します。この基盤に基づき、我々は具現化AIから深い人間とAIの協力の新しいパラダイムへの移行を探求します。共身体AIの原初的な概念に根ざし、このパラダイムシフトを体系的に調査するために人間中心の技術的視点を採用します。具体的には、知覚的整合性、共同意思決定、行動ガイダンス、および双方向の相互学習といった重要な次元における突破口について議論します。これらの努力は、三つのコア特性を実現することを目指しています:人間中心の自己中心的基盤、二重モードの認知統合、そして物理的共身体性です。我々の知る限り、この作業は、具現化AIの進展に基づいていますが、根本的に人間の身体と意図を中心に知能を再定位するための、共身体AIを実現するための技術的フレームワークと実施ロードマップの最初の体系的構築を構成します。この分野における未来の研究のための基礎的な参考を提供します。
Feng et al.(水曜日)はこの問題を研究しました。