MSVIT: Verbesserung des Spiking Vision Transformers durch multi-skala Aufmerksamkeitsfusion | Synapse