Zeitgemäße Modellkomprimierung bei der Inferenz großer Sprachmodelle | Synapse