Article

KI ändert Call-Center-Akzente in Echtzeit – Telekom in der Kritik

ki telekom audio ethik

Telekommunikationsunternehmen TELUS setzt eine Speech-to-Speech-KI ein, um die Akzente von Call-Center-Agenten in Echtzeit zu verändern. Die Technologie stammt von Tomato.ai und wird bei Offshore-Agenten angewandt, um “akzentbedingte Reibung” zu reduzieren.

Kontroverse Praxis

Arbeitsrechtliche Gruppen kritisieren die Praxis als irreführend und fordern Offenlegungspflichten gegenüber Kunden. Die Technologie nutzt Spracherkennung, Sprecherkonvertierungsmodelle und neuronale Vocoder, um Spracheingaben in nahezu echtzeitkorrigierte Audioausgaben zu transformieren.

Kritiker betonen, dass die Identität des Sprechers verschleiert wird – ein Aspekt, der sowohl datenschutzrechtliche als auch arbeitsrechtliche Fragen aufwirft. Wettbewerber wie Rogers und Bell haben laut Berichten keine Pläne, ähnliche Technologien einzuführen.

Technischer Hintergrund

Realtime-Voice-Conversion bei geringer Latenz erfordert robuste Frontend-ASR-Modelle und latenzoptimierte Inferenz. Die Pipeline muss mit Hintergrundlärm in Call-Center-Umgebungen umgehen und gleichzeitig natürlichkeitserhaltend arbeiten. Praktiker enfrent dabei Tradeoffs zwischen Latenz, Natürlichkeit und Robustheit.

Link: TELUS AI Accent Story