改良された双遅延深層決定論的ポリシー勾配とRRT*に基づくマニピュレーターの経路計画手法 | Synapse