Article

Stimme als Schwachstelle: Unhörbare Audio-Angriffe auf KI-Systeme

news security ki voice adversarial

AudioHijack: Forscher manipulieren Sprach-KI mit unhörbaren Signalen

Neue Forschung zeigt dass AI-gestützte Sprach-Tools durch unsichtbare manipulierte Audio-Clips gekapert werden können. Die Methode AudioHijack erreicht Erfolgsraten von 79 bis 96 Prozent.

Wie der Angriff funktioniert

Large Audio-Language Models (LALMs) können Anweisungen im Audio-Format empfangen. Die Schwachstelle: Bösartige Instruktionen können in manipulierten Clips versteckt werden. Ein halbe Stunde Training reicht um kontext-agnostische Angriffssignale zu erstellen die bei jedem Nutzer funktionieren.

Praktische Auswirkungen

Die Autoren testeten 13 führende Open-Modelle inklusive Microsoft und Mistral Voice Services. Sie konnten Modelle dazu bringen:

  • Sensible Weberchen durchzuführen
  • Dateien von angreifer-kontrollierten Quellen herunterzuladen
  • E-Mails mit Nutzerdaten zu versenden

Verteidigung

Die Forscher empfehlen öffentliche Modelle mit zusätzlichen Sicherheitsvorkehrungen. Organische Guardrails des Mythos Preview reichen nicht aus sie sind inkonsistent und können durch andere Präsentationsweisen umgangen werden.

Link: Original bei IEEE Spectrum