Direkt zum Inhalt wechseln
logo Mobiler Lifestyle, Streaming und Smart Finance
Bei Podcasts

Spotify testet praktische neue KI-Funktion

Symbolbild: Spotify-App auf Smartphone und im Hintergrund das Logo.
TECHBOOK verrät, wie man mit Spotifys Voice Translation bald englische Podcasts auf Deutsch hören kann. Foto: picture alliance / NurPhoto | Jonathan Raa
Natalie Wetzel, TECHBOOK
Werkstudentin

26.09.2023, 14:02 Uhr | Lesezeit: 7 Minuten

Sprachbarrieren überwinden, Menschen verbinden – diese hehren Ziele hat sich Spotify bei der Vorstellung seiner neuesten Funktion auf die Fahne geschrieben. Doch Voice Translation kann mehr als nur übersetzen. TECHBOOK-Redakteurin Natalie Wetzel hat reingehört, wie gut die neue KI-Funktion tatsächlich ist.

Artikel teilen

Mit etwa 70.000 deutschsprachigen Podcasts auf Spotify ist die hiesige Podcast-Szene recht solide aufgestellt. Das Angebot erstreckt sich über professionelle Nachrichtenpodcasts, kommerzielle Unterhaltungsformate bis hin zu niedrigeschwelligen Hobbyaufnahmen und allen Nuancen dazwischen. Auch die Themenvielfalt ist groß und wird zunehmend diverser. Und dennoch schielt der ein oder andere Nutzer neugierig auf die restlichen gut 3,5 Millionen Podcasts, die Spotify bereithält. Wäre da nicht die Sprachbarriere. Doch für genau dieses Problem hat Spotify eine Lösung erarbeitet: die KI-basierte Voice Translation.

KI als Brücke über die Sprachbarriere

Das Ergebnis ist so simpel wie genial: Die KI übersetzt den Podcast in die Zielsprache und „klont“ dabei die Stimme und Sprechgewohnheiten der sprechenden Person. „Über alle Kulturen, Länder und Gemeinschaften hinweg bringen uns die Geschichten, die wir teilen, zusammen. Und meistens sind es die Stimmen der Sprecher, die den Geschichten ebenso viel Gewicht verleihen wie die Erzählungen selbst.“ Mit dieser etwas blumigen Formulierung eröffnet Spotify sein Statement, in dem es die Pilotphase der Voice Translation ankündigt. Den (ursprünglich fremdsprachlichen) Lieblingspodcast von nun an in der eigenen Muttersprachen hören – das soll eines Tages das Ziel sein.

Twitter Placeholder
An dieser Stelle findest du Inhalte aus Twitter
Um mit Inhalten aus Sozialen Netzwerken zu interagieren oder diese darzustellen, brauchen wir deine Zustimmung.

Voice Translation – so funktioniert es

Schon im Mai 2023 verriet Bill Simmons, der Gründer des zu Spotify gehörenden Sportpodcast-Netzwerks „The Ringer“, dass der schwedische Musikstreaming-Anbieter an einer Stimmen imitierenden KI-Funktion arbeite. Simmons warf dabei Überlegungen über den Einsatz von KI-generierten Stimmen bekannter Podcast-Hosts zu Werbezwecken in den Raum. Natürlich nur mit deren Einverständnis. Spotify selbst hielt sich damals noch bedeckt: „Werbung ist ein interessantes Feld für künftige Untersuchungen, aber wir haben zu diesem Zeitpunkt nichts anzukündigen.“ Das hat sich mit der nun vorgestellten Voice Translation geändert, wenn auch nicht im Bereich Werbung.

Spotifys Voice Translation basiert auf Whisper, einem KI-Transkriptionstool von OpenAI. Das Spracherkennungssystem wurde mit hunderttausenden, überwiegend englischsprachigen Audiodateien trainiert und kann nun Gesprochenes zwischen ausgewählten Sprachen hin und her übersetzen. Gleichzeitig kann Whisper die charakteristischen Sprechmerkmale der Podcasthosts – zum Beispiel Tonfall, Pausen und Füllwörter – in die Zielsprache übertragen.

Lesen Sie auch: Übersetzungs-KI „HeyGen“ im Test: „Beängstigend gut“

Kostprobe gefällig?

Wer sich von der Leistungsfähigkeit Whispers überzeugen möchte, kann auf dem eigens eingerichteten Hub in einige Pilotfolgen reinhören. Seit dem 25. September finden sich hier zunächst drei Folgen, die Whisper aus dem Englischen ins Spanische übersetzt hat:

  • DOAC: E256 – Dr. Mindy Pelz (15. Juni 2023)
  • Lex Fridman Podcast: #390 – Yuval Noah Harari (17. Juli 2023)
  • KB: Armchair Expert with Dax Shepard (14. August 2023)

In den nächsten Tagen und Wochen sollen weitere Übersetzungen ins Deutsche und Französische folgen. Außerdem möchte Spotify nach eigenen Angaben weitere Podcasts in die Pilotreihe aufnehmen. Dazu gehören Dax Shepards „eff won with DRS“, The Ringers „The Rewachtables“ sowie der neue Podcast von Trevor Noah, dem Ex-Moderator der „Daily Show“. Eine gewisse Schwerpunktsetzung hin zum Sport und zu gesellschaftlichen Themen zeichnet sich hier bereits ab.

Mehr zum Thema

Wer kann Voice Translation nutzen?

Ob und wie Spotify Voice Translation weiter ausbauen und einem breiteren Kreis von Podcast-Produzenten zur Verfügung stellen wird, hängt maßgeblich vom Feedback während der Pilotphase ab. Dass die bisher übersetzten Folgen mindestens anderthalb Monate alt sind, legt die Vermutung nahe, dass Whisper noch nicht völlig problemlos arbeitet. Unklar ist außerdem, wie genau die Zusammenarbeit mit den Hosts aussieht und welche Bedingungen Spotify für die Zukunft im Auge hat. Kostet der Einsatz von Voice Translation die Produzenten und wenn ja, wie viel?

Aktuell heißt es grundsätzlich, dass mit Voice Translation bearbeitete Podcastfolgen allen Usern zur Verfügung stehen. Ob die Funktion auch in Zukunft für alle – also auch für jene mit einem kostenlosen Abo – zugänglich bleibt, wird sich zeigen. Spotify selbst könnte sich von der Auflösung der Sprachbarriere wachsende Nutzerzahlen erhoffen. In jedem Fall aber dürfte sich die Reichweite mancher Podcaster massiv vergrößern, sobald sich Voice Translation einmal etabliert hat. Dass bei kommerziellen Podcasts damit auch die Einnahmen in die Höhe schnellen, macht das Modell sicherlich nicht unattraktiver. Bis Voice Translation allen Podcastern zur Verfügung steht und die Nutzer ihre persönlichen Lieblingspodcasts wirklich in der eigenen Muttersprache hören können, wird es aber wohl noch einige Zeit dauern.

Autorenfoto

TECHBOOK meint


„Ich persönlich bin hin- und hergerissen zwischen Begeisterung und Skepsis. Das Konzept selbst ist großartig und ein Game Changer für alle, die keine oder nur wenige Fremdsprachen beherrschen. Ich möchte nicht erst Japanisch lernen, um mich in japanische Koch-Podcasts zu vertiefen, oder Polnisch, um mich direkt zu informieren. Und selbst mit ausgezeichneten Englischkenntnissen kann es manchmal schwierig sein, die Fachbegriffe zu verstehen, die NFL-Kommentatoren mit sich überschlagenden Stimmen ins Mikrofon brüllen, während man selbst gerade in der U-Bahn sitzt. Spotifys Voice Translation könnte den individuellen Nutzern also viel Erleichterung bringen und Communities helfen, sich zu vernetzen. Wenn das Feature schon so weit wäre.

Doch aktuell bestimmt noch Spotify, welche Podcasts international zugänglich sein sollen. Und das sind, wenig überraschend, große Podcasts von etablierten Hosts. Auch die Sprachauswahl ist erstmal auf die üblichen Verdächtigen begrenzt: Englisch, Spanisch, Französisch und Deutsch. Man kann nur hoffen, dass Spotify bald auch Übersetzungen in und aus anderen, auch nicht-europäischen Sprachen vorlegt.
Interessant ist auch, wie authentisch die übersetzten Podcasts letztlich sein können, und zwar sowohl auf technischer als auch auf menschlicher Ebene. „Durch den Abgleich mit der Stimme des Urhebers ermöglicht Voice Translation Hörern auf der ganzen Welt, neue Podcaster zu entdecken und sich von ihnen inspirieren zu lassen – und das auf authentischere Weise als je zuvor“, sagt zumindest Ziad Sultan, Vice Präsident of Personalization von Spotify.

Ich habe in die bestehenden Übersetzungen reingehört, aber da sie bisher nur auf Spanisch vorliegen, kann ich nur ein eingeschränktes Urteil abgeben. Wirklich perfekt imitieren kann Voice Translation die Stimmen der Hosts noch nicht, gerade was den exakten Ton angeht. Pausen, Schwankungen in der Betonung, Geschwindigkeit und Stimmmelodie scheinen aber verblüffend nah am Original zu sein. Vor allem hört man den Stimmen ihren künstlichen Ursprung kaum oder sogar gar nicht an. Insofern hat Voice Translation absolut Potenzial. Nun muss das Tool nur noch möglichst einfach möglichst vielen Podcastern zur Verfügung gestellt werden.“ – Natalie Wetzel

Themen Spotify
Deine Datensicherheit bei der Nutzung der Teilen-Funktion
Um diesen Artikel oder andere Inhalte über Soziale-Netzwerke zu teilen, brauchen wir deine Zustimmung für
Sie haben erfolgreich Ihre Einwilligung in die Nutzung dieser Webseite mit Tracking und Cookies widerrufen. Sie können sich jetzt erneut zwischen dem Pur-Abo und der Nutzung mit personalisierter Werbung, Cookies und Tracking entscheiden.