Nicht alle Experten sind gleich: Effizientes Kürzen und Überspringen von Experten für Mixture-of-Experts Große Sprachmodelle | Synapse