https://www.faz.net/-gy9-10dcw

Spracherkennung : Alternative zum Abschreiben

So könnte es auch funktionieren Bild: Damm

Kann man eine Spracherkennung am PC auch zur Verschriftlichung von Interviews einsetzen? Diese Frage stellen sich nicht nur Journalisten. Der Einsatz pfiffiger Software liegt nahe. Doch so einfach ist es nicht, wie der Test zeigt.

          Kann man eine Spracherkennung am PC auch zur Verschriftlichung von Interviews einsetzen? Diese Frage wird uns immer wieder gestellt, nicht nur von Kollegen aus dem journalistischen Umfeld, sondern auch von Studenten, die in der Sozialforschung oder Psychologie lange Wortinterviews transkribieren müssen. Wer seine Aufzeichnungen von einem Dienstleister abschreiben lässt, zahlt ungefähr 150 bis 200 Euro je Stunde Gesprächszeit und wartet mehrere Tage auf die Datei. So liegt der Einsatz pfiffiger Software also nahe. Das Standardsystem Dragon Naturally Speaking für Windows erreicht zudem eine nahezu perfekte Erkennungsleistung, bei geübten Diktierern. Mit diesem Nebensatz sind die Probleme schon angesprochen. Dragon ist ein Diktiersystem. Es erwartet, dass der Sprecher ein kurzes, etwa fünf- bis zehnminütiges Training absolviert hat, bei dem die Eigenheiten seiner Aussprache erfasst und in einem Benutzerprofil gespeichert werden. Es setzt weiterhin voraus, dass man sein persönliches Vokabular einspeist und vor allem kontinuierlich korrigiert, denn Dragon lernt aus seinen Fehlern.

          Michael Spehr

          Redakteur im Ressort „Technik und Motor“.

          Auch muss man diktieren können und das Diktat als Arbeitstechnik beherrschen. So ist nicht zu erwarten, dass die Software zehn Minuten nach der Installation eine beliebige Aufnahme perfekt umsetzt. Erst wenn man zwei, drei Wochen intensiv mit Dragon gearbeitet hat, stellen sich gute Ergebnisse ein. Hinzu kommen weitere technische Beschränkungen. Dragon lässt sich zwar mit verschiedenen Sprechern einsetzen, aber es ist stets nur ein Profil aktiv. Für die Verschriftlichung von Interviews müsste die Software nicht nur die Sprachmodelle der Beteiligten parat haben, sondern den jeweils aktiven Sprecher identifizieren und umschalten (und der andere dürfte nicht dazwischenreden). Das alles funktioniert aber nicht. Weiterhin werden beim Diktat die Interpunktionszeichen und Absatzenden gesprochen: Dragon orientiert sich daran und erkennt auf diese Weise sinnhaft Zusammengehörendes. Auch dieses wichtige Detail fehlt bei der gewohnten Konversation, bestenfalls käme also nur eine Aneinanderreihung einzelner Worte ohne Punkt und Komma dabei heraus.

          Die Akustik ist eher schlecht

          Um das Ganze in der Praxis auszuprobieren, setzten wir dem Drachen ein mit dem Diktiergerät aufgenommenes Interview vor. Die Akustik ist eher schlecht, mehrere Gesprächspartner sitzen weit voneinander entfernt, eine Stimme ist nur sehr leise zu hören. Lärm im Hintergrund stört. Das Ergebnis ist wie erwartet: Dragon arbeitet nahezu endlos vor sich hin und versucht, irgendwelche vernünftigen Sätze zu formen, scheitert aber. Es werden nur unzusammenhängende einzelne Wörter transkribiert.

          Im nächsten Anlauf nehmen wir mit besserem Equipment in sehr ruhiger Umgebung auf. Jeder Beteiligte hat sein eigenes Mikrofon vor sich. Beim ersten Sprecher, dessen Benutzerprofil geladen ist, gelingt eine ordentliche Transkription, wenngleich ohne Punkt und Komma. Aber für den zweiten fehlt das Sprachmodell, und damit gerät Naturally Speaking ins Stolpern. Viele Begriffe werden zwar richtig erkannt, aber brauchbar ist das Ganze nicht. Es fehlt also ein universelles Benutzerprofil unabhängig von Sprecher, Dialekt, Geschlecht und Alter. So etwas gibt es für die englische Sprache beim amerikanischen Anbieter Know Brainer (www.knowbrainer.com). Der Hersteller verspricht viel für sein „Uni Voice“: Es sei besser als ein selbsterstelltes Profil. Das können wir nicht beurteilen, aber angemerkt sei doch, dass Firmenchef Lunis Orcutt der amerikanische Spracherkennungs-Guru ist.

          Weitere Themen

          Ein Porsche ist kein Ponyhof Video-Seite öffnen

          Fahrbericht Porsche 911 Cabriolet : Ein Porsche ist kein Ponyhof

          Porsche ist mit dem 911 Cabriolet ein tolles Auto gelungen – wenngleich das Verdeck manche Schwächen aufweist. F.A.Z-Redakteur Holger Appel hat den Wagen getestet und erklärt, warum 180.000€ nicht zwingend in eine Eigentumswohnung investiert werden müssen.

          Intelligent gelöst

          Schlusslicht : Intelligent gelöst

          Er reicht nicht, keine Ahnung zu haben, man muss auch auf den Mond schauen. Dann ergibt sich die künftige Klimasteuer fast von selbst.

          Topmeldungen

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Abonnieren Sie unsere FAZ.NET-Newsletter und wir liefern die wichtigsten Nachrichten direkt in Ihre Mailbox. Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.