SafeDPO: Ein einfacher Ansatz zur direkten Optimierung von Präferenzen mit verbesserter Sicherheit | Synapse