Da Sprachübersetzungssysteme (ST) zunehmend verbreitet sind, ist das Verständnis ihrer Schwachstellen entscheidend für eine robuste und zuverlässige Kommunikation. Allerdings wurde dieses Thema nur begrenzt vertieft untersucht. Dieses Papier untersucht Methoden, um diese Systeme durch unmerkliche Audio-Manipulationen zu kompromittieren. Insbesondere präsentieren wir zwei Ansätze: (1) die Anpassung von perturbationsbasierten Techniken, die für Angriffe auf die automatische Sprach- erkennung (ASR) verwendet werden, an den ST-Kontext, wodurch unsere Arbeit die erste ist, die diesen Ansatz auf ST anwendet, und (2) die Vorschlag einer neuartigen musikgenerierenden Methode zur gezielten Übersetzung, während wir auch praktischere Angriffe über den Luftweg in der physischen Welt durchführen. Unsere Experimente zeigen, dass sorgfältig gestaltete Audio-Perturbationen Übersetzungsmodelle irreführen können, um gezielte, schädliche Ausgaben zu erzeugen, während adversariale Musik dieses Ziel verdeckter erreicht und die natürliche Unmerklichkeit von Musik ausnutzt. Diese Angriffe haben sich in mehreren Sprachen und Übersetzungsmodellen als effektiv erwiesen und heben eine systematische Schwachstelle in aktuellen ST-Architekturen hervor. Über unmittelbare Sicherheitsbedenken hinaus werfen unsere Ergebnisse breitere Herausforderungen für die Robustheit und Interpretierbarkeit neuronaler Sprachsysteme auf. Weitere Details und Beispiele finden Sie unter https://adv-st.github.io.
Liu et al. (Thu,) haben diese Frage untersucht.