Training von Sprachmodellen zur Befolgung von Anweisungen mit menschlichem Feedback | Synapse