Multimedia
Newsroom – Marc Bartl

KI ersetzt Paul Ronzheimer

KI ersetzt Paul Ronzheimer Paul Ronzheimer (Foto: Wolf Lux)

KI-Offensive: „Bild“ will mit synthetischer Ronzheimer-Stimme englischsprachiges Publikum erreichen. Wie das funktioniert.

Berlin – Ab sofort sind ausgewählte Bild-Podcasts auch auf Englisch verfügbar. Möglich macht dies eine Kooperation zwischen „Bild“ und ElevenLabs, einem Entwickler von KI-Audiomodellen. Der Clou: Die Stimme und den Stil des ursprünglichen Sprechers sollen sprachübergreifend beibehalten werden. 

 

ElevenLabs entwickelt KI-Audiomodelle, „die realistische, abwechslungsreiche und emotional nuancierte Sprache in 29 Sprachen erzeugen“. Ihr KI-Synchronisierungstool kann darüber hinaus Audio zwischen diesen Sprachen übersetzen und dabei die Stimme und den Stil des ursprünglichen Sprechers sprachübergreifend beibehalten.

 

„Bild“ will mit Hilfe von ElevenLabs das bislang überwiegend deutschsprachige Audio-Angebot, um weitere Sprachen zu erweitern und dabei sowohl die KI von ElevenLabs als auch die selbst entwickelte Audio-KI von Axel Springer, aravoices, nutzen.

 

Zu den ersten englischsprachigen Angeboten, die mit Hilfe von ElevenLabs für Bild generiert werden, gehören aktuelle Folgen der Podcasts RONZHEIMER. und FC BAYERN INSIDER, die auch für ein internationales Publikum interessant sind. Die mit synthetischer Stimme gesprochenen Folgen der Podcasts werden für die Hörer als KI-generiert gekennzeichnet und erscheinen bei den Podcast-Portalen in einer eigenen Playlist.

 

Claudius Senst, CEO Bild-Gruppe, zur Strategie: „Wir loten bei Axel Springer aktiv die Möglichkeiten und Chancen aus, wo und wie wir durch den Einsatz von Künstlicher Intelligenz Journalismus stärken und unsere digitale Reichweite ausbauen können. So haben wir Ende 2023 mit Hey_ bei ,Bild‘ einen KI-Helfer gestartet, der seitdem schon über 45 Millionen Fragen beantwortet hat. Durch die Kooperation mit ElevenLabs wollen wir nun für Bild testen, wie wir geeignete Audioinhalte mit personalisierter Stimme auch für ein englischsprachiges Publikum noch attraktiver machen können.“

 

„Wir freuen uns über die Zusammenarbeit mit ,Bild‘, Deutschlands größter Medienmarke", sagt Mati Staniszewski, Co-Gründer von ElevenLabs. „Jetzt können Bild-Podcasts weltweit mehr Menschen erreichen, Sprachbarrieren überwinden und so die Zugänglichkeit verbessern. Da unsere KI die Originalstimme bei der Übersetzung beibehält, können Zuschauer weltweit nun Podcasts wie die von Paul Ronzheimer in ihrer eigenen Sprache erleben, vorgetragen in deren authentischem Stil.”

 

Hintergrund
„Bild“ und „Welt“ verfügen bereits beginnend 2020 über spezifische synthetische Markenstimmen, die von Axel Springers eigenentwickelter Audio-KI aravoices erstellt wurden. Mithilfe dieser Markenstimmen sowie einem vollautomatisierten Distributionsprozess generiert und publiziert aravoices für beide Marken über 2 Millionen Audiostreams im Monat. Mit dem Angebot von aravoices wird nicht nur die Audionutzung und die steigende Monetarisierung durch Audiowerbung gestärkt, sondern auch der barrierefreie Zugang zu journalistischen Inhalten. „Bild“ allein veröffentlicht mittlerweile bis zu 40.000 Audio-Artikel pro Jahr, welche für vielseitige Formate, wie der Vorlesefunktion auf Bild.de, Playlisten auf Spotify und Apple Podcasts sowie Alexa News Update genutzt werden.

 

Anne Küpper, Director Product & Engineering bei Axel Springer: „Durch die Kooperation mit ElevenLabs können wir unsere Markenstimmen nun um spezifische, lebensechte Autorenstimmen erweitern.“