Orchestration Adaptative pour l'Inférence à Grande Échelle sur des Systèmes Accélérateurs Hétérogènes : Équilibrer Coût, Performance et Résilience | Synapse