Verbesserung des Deep Reinforcement Learning mit transitionalen variationalen Autoencodern: Eine Anwendung im Gesundheitswesen | Synapse