Article
Stimme als Schwachstelle: Unhörbare Audio-Angriffe auf KI-Systeme
AudioHijack: Forscher manipulieren Sprach-KI mit unhörbaren Signalen
Neue Forschung zeigt dass AI-gestützte Sprach-Tools durch unsichtbare manipulierte Audio-Clips gekapert werden können. Die Methode AudioHijack erreicht Erfolgsraten von 79 bis 96 Prozent.
Wie der Angriff funktioniert
Large Audio-Language Models (LALMs) können Anweisungen im Audio-Format empfangen. Die Schwachstelle: Bösartige Instruktionen können in manipulierten Clips versteckt werden. Ein halbe Stunde Training reicht um kontext-agnostische Angriffssignale zu erstellen die bei jedem Nutzer funktionieren.
Praktische Auswirkungen
Die Autoren testeten 13 führende Open-Modelle inklusive Microsoft und Mistral Voice Services. Sie konnten Modelle dazu bringen:
- Sensible Weberchen durchzuführen
- Dateien von angreifer-kontrollierten Quellen herunterzuladen
- E-Mails mit Nutzerdaten zu versenden
Verteidigung
Die Forscher empfehlen öffentliche Modelle mit zusätzlichen Sicherheitsvorkehrungen. Organische Guardrails des Mythos Preview reichen nicht aus sie sind inkonsistent und können durch andere Präsentationsweisen umgangen werden.