KI in der Hörbuchproduktion

KI in der Hörbuchproduktion : Ein atemraubendes Unterfangen

Könnten künstliche Intelligenz und synthetische Stimmen den Hörbuchmarkt übernehmen? Erste Unternehmen stehen in den Startlöchern. Sprecher sehen mehr in Gefahr als ihr Geschäft.

Schauspieler, Synchronsprecher und Hörbuchstimme: Christian Brückner im Juli 2012 in seinem Studio Bild: Andreas Pein

Für Edward Herrmann ist es bereits Wirklichkeit geworden, genauer gesagt für die Fans des Silvester 2014 gestorbenen Hörbuchsprechers und Schauspielers, der hierzulande vor allem als Vater und Großvater der Serie „Gilmore Girls“ bekannt geworden ist. Und für die Erben, die eingewilligt haben, dass die Stimme Edward Herrmanns auch nach seinem Tod für neue Hörbuchproduktionen eingesetzt wird: Das Unternehmen DeepZen hat eine Künstliche Intelligenz mit Aufnahmen des Sprechers gefüttert und so trainiert, dass sie den Stimmklang, die Sprachmelodie, Betonungen und Tempi des Originals reproduzieren kann und damit Texte in Sprache umwandelt, fast als hätte Herrmann sie vorgelesen.

Text-to-Speech (TTS) heißt das Verfahren, vielfach angewandt in Navigationssystemen oder digitalen Assistenten. Jetzt schickt es sich an, den Hörbuchmarkt aufzumischen, einen der Bereiche mit den größten Wachstumszahlen im gesamten Buchmarkt. Das Unternehmen Speechki, wie DeepZen auf den Text-to-Speech-Einsatz bei der Hörbuchproduktion spezialisiert, hat im vergangenen Jahr, als das Unternehmen sein Angebot auf der Frankfurter Buchmesse vorstellte, 560 Hörbücher in sechzehn Sprachen produziert. Im kommenden Jahr sollen es eine Million Titel sein.