Das Voranstellen von Attention Sinks kann Aktivierungsaußreißer bei der Quantisierung großer Sprachmodelle mildern | Synapse