Hierarchisches Verstärkungslernen mit der MAXQ-Wertfunktionszerlegung | Synapse