Bench-2-CoP: Können wir der Benchmarking für die EU AI-Konformität vertrauen? | Synapse