Diffuser : Transformateurs Efficaces avec Diffusion d'Attention Multi-Saut pour Longues Séquences | Synapse