March 3, 2026

Untersuchung von Sicherheitsanfälligkeiten in mehrsprachigen Sprachübersetzungssystemen durch irreführende Eingaben

Key Points

Sorgfältig gestaltete Audio-Perturbationen führen Übersetzungsmodelle in die Irre und erzeugen schädliche Ausgaben.
Adversariale Musiktechniken nutzen unauffällig die natürliche Unmerklichkeit von Audio und erhöhen die Angriffs- effektivität.
Verschiedene Experimente zeigen, dass diese Angriffe in mehreren Sprachen und Modellen effektiv sind.
Die Ergebnisse betonen die Notwendigkeit einer verbesserten Robustheit und Interpretierbarkeit in neuronalen Sprachsystemen.

Abstract

Da Sprachübersetzungssysteme (ST) zunehmend verbreitet sind, ist das Verständnis ihrer Schwachstellen entscheidend für eine robuste und zuverlässige Kommunikation. Allerdings wurde dieses Thema nur begrenzt vertieft untersucht. Dieses Papier untersucht Methoden, um diese Systeme durch unmerkliche Audio-Manipulationen zu kompromittieren. Insbesondere präsentieren wir zwei Ansätze: (1) die Anpassung von perturbationsbasierten Techniken, die für Angriffe auf die automatische Sprach- erkennung (ASR) verwendet werden, an den ST-Kontext, wodurch unsere Arbeit die erste ist, die diesen Ansatz auf ST anwendet, und (2) die Vorschlag einer neuartigen musikgenerierenden Methode zur gezielten Übersetzung, während wir auch praktischere Angriffe über den Luftweg in der physischen Welt durchführen. Unsere Experimente zeigen, dass sorgfältig gestaltete Audio-Perturbationen Übersetzungsmodelle irreführen können, um gezielte, schädliche Ausgaben zu erzeugen, während adversariale Musik dieses Ziel verdeckter erreicht und die natürliche Unmerklichkeit von Musik ausnutzt. Diese Angriffe haben sich in mehreren Sprachen und Übersetzungsmodellen als effektiv erwiesen und heben eine systematische Schwachstelle in aktuellen ST-Architekturen hervor. Über unmittelbare Sicherheitsbedenken hinaus werfen unsere Ergebnisse breitere Herausforderungen für die Robustheit und Interpretierbarkeit neuronaler Sprachsysteme auf. Weitere Details und Beispiele finden Sie unter https://adv-st.github.io.

Bookmark

Untersuchung von Sicherheitsanfälligkeiten in mehrsprachigen Sprachübersetzungssystemen durch irreführende Eingaben

Key Points

Abstract

Cite This Study