Zur stochastischen optimalen Steuerung und Verstärkungslernen durch approximative Inferenz | Synapse