https://www.faz.net/aktuell/technik-motor/digital/spracherkennung-dragon-15-der-versteht-es-14420742.html

Spracherkennung Dragon 15 : Der versteht es

Fast fehlerfreie Spracherkennung für Windows Bild: Hersteller

Nuance bringt die nächste Version seiner Spracherkennungssoftware Dragon Naturally Speaking an den Start. Sie ist für den professionellen Einsatz gedacht. Wir haben mit ihr gesprochen.

          3 Min.

          Wir hatten es unlängst in einem längeren Marktüberblick richtig vorausgesagt: Der amerikanische Hersteller Nuance bringt die nächste Version seiner Spracherkennungssoftware Dragon Naturally Speaking an den Start. Sie ist für den professionellen Einsatz gedacht. Im Unterschied zu Siri und ähnlichen Smartphone-Kollegen arbeitet ein solches Programm ohne Internetverbindung und ist lernfähig. Es lässt sich nicht nur um das eigene Vokabular ergänzen, sondern auch um die Eigenheiten der jeweils individuellen Aussprache. Wer mit einer solchen Software richtig umgeht, erhält von Tag zu Tag bessere Ergebnisse, weil beispielsweise Eigennamen oder oft verwendete Spezialbegriffe im Vokabular landen. Nun ist tatsächlich die neue Version 15 des Drachens im Handel, wir probierten die Variante Professional Individual für 400 Euro aus. Wer sparen will, warte bis die Premium mit der Kennziffer 15 erhältlich ist. Von der kleinsten Modellvariante Home raten wir indes ab.

          Michael Spehr
          Redakteur im Ressort „Technik und Motor“.

          Wie wir im August geschrieben hatten, arbeitet Dragon Naturally Speaking schon seit langem unter Windows fast fehlerfrei. Jedenfalls bei einem allgemeinen Wortschatz. Je komplexer das Vokabular und je mehr Fachbegriffe oder Eigennamen verwendet werden, desto kniffeliger wird die Sache. Typische Probleme sind ferner Groß- und Kleinschreibung, Getrennt- und Zusammenschreibung, Abkürzungen und Produktnamen. Die Angabe, dass von 100 diktierten Worten ein oder zwei falsch transkribiert werden, also die Genauigkeit bei 98 oder 99 Prozent liege, muss sinnvollerweise ergänzt werden um Hinweise zur Komplexität des Diktats. Denn fehlerfreie 100 Prozent sind bei einfachen Texten mühelos zu schaffen.

          Das Diktat bestand aus Alltagssprache

          Wir verglichen die neue 15 mit der älteren Professional 13 in folgendem Testverfahren: Zunächst wurde ein rund fünfminütiges Referenzdiktat mit einem hochwertigen Diktiergerät (Philips DPM 8000) aufgezeichnet. Das Diktat bestand aus Alltagssprache, aber auch etlichen kleinen Gemeinheiten, etwa Abkürzungen oder „Denglisch“ sowie Fachbegriffen. Das Diktat transkribierte zunächst die Version 13 auf einem Windows-10-Rechner mit Core-i7-Prozessor und 16 Gigabyte Arbeitsspeicher. Dann wurde das Vokabular der alten Software exportiert. Nur die Wortliste wohlgemerkt, nicht das Benutzerprofil mit der gespeicherten Aussprache.

          Anschließend wurde Version 13 deinstalliert und die neue 15 auf demselben Rechner eingerichtet. Das früher lange Sprechertraining beschränkt sich inzwischen auf wenige Sätze. Man kann also gleich loslegen. Wir importierten rund 500 Worte aus dem alten Vokabular und verzichteten auf das Angebot, deren Aussprache zu trainieren. Nach einer halben Stunde mit einem ersten Rundgang durch die Menüs musste dann Dragon 15 dasselbe Musterdiktat umsetzen. Beide Texte wurden verglichen. Das Ergebnis: Die neue Version 15 verstand uns auf Anhieb besser, etwa bei ähnlich klingenden Wortendungen. Wo die alte aus „gern “ ein „gerne“ machte und die „Foto-Community“ fälschlich in den Plural setzte, arbeitete die 15 fehlerfrei. Der Feinschliff ist also erkennbar. Beide Programme akzeptierten viel „Denglisch“, scheiterten aber an Raw-Formaten (daraus wurden Rohr-Formate) und Voip-Anrufen (Wort-Anrufen). Unser Ergebnis, für dieses eine Diktat: Das frisch aufgespielte Dragon 15 kam auf eine Genauigkeit von 99 Prozent, während Dragon 13, welches sich bereits zwei Jahre lang an unsere Eigenheiten gewöhnen konnte, 98,5 Prozent erreichte. Mit anderen Texten kann es andere Ergebnisse geben.

          Wir probierten die Software in sehr ruhiger Umgebung aus

          Die Besonderheit der neuen Version soll eine auf Mustererkennung basierende Deep-Learning-Technik sein, die Stimmmuster, Dialekte und Akzente besser erfasse und sich zudem auch für die Akustik von Großraumbüros eigne. Dies werden wir beobachten. Wir probierten die Software in sehr ruhiger Umgebung aus. Wie gehabt erlaubt die Variante Professional Individual eine geräteübergreifende Nutzung des eigenen Vokabulars. Es wird in der Cloud gespeichert und automatisch mit verschiedenen Geräten synchronisiert. Was am Rechner ergänzt wurde, steht also auch in der Diktat-App fürs Smartphone während der mobilen Texterfassung zur Verfügung. Dieser Komfort, den der Hersteller Dragon Anywhere nennt, verlangt zusätzlich ein Abonnement für 200 Euro im Jahr oder 20 Euro im Monat.

          Neu in Version 15 ist zudem die Option, dass bei der Umsetzung einer Audiodatei die Satzzeichen automatisch eingefügt werden. Für den Spracherkennungs-Profi, der stets Punkt und Komma mitspricht, ist das sehr ungewöhnlich, basiert doch die Kunst des Diktierens gerade darauf, den Text damit zu strukturieren. Dragon 15 fügt indes nur Punkt und Komma ein, keinen Gedankenstrich, keinen Doppelpunkt und natürlich auch keinen neuen Absatz. Diese Funktion hat also etwas Experimentelles, und die Ergebnisse sind interessant, aber noch nicht zufriedenstellend. Geübte Dragon-Nutzer werden also weiterhin die Interpunktionszeichen vollständig diktieren. Indes deutet sich mit dieser Funktion an, dass die amerikanische Software demnächst in der Lage sein könnte, natürlich sprachliche Texte noch besser zu erfassen - und vor allen Dingen auch Interviews zu transkribieren. Dazu müsste allerdings neben der Interpunktion noch eine zweite Hürde fallen, nämlich die Verwendung von nutzerspezifischen Sprachprofilen, wenn mehrere Menschen im Interview reden und sich gegebenenfalls ins Wort fallen.

          Weitere Themen

          Fahrtenschreiber

          Der F.A.Z.-Autoticker : Fahrtenschreiber

          Deutschland exportiert mehr Elektroautos und weniger Verbrenner ++ Elektromotor ist effizienter als ein Dieselantrieb ++ ZF spricht sich für den Einsatz von E-Fuels aus

          Topmeldungen

          Bundeskanzler Olaf Scholz (SPD) am 16. März im Deutschen Bundestag.

          Vor dem Koalitionsausschuss : Papa muss es richten

          Die Koalition droht ihre Dauerkrise zum Markenzeichen zu machen. Scholz kann aber darauf bauen, dass Grüne und FDP sich einig sind, bedingungslos beieinander zu bleiben. Das ist die neue Form der Alternativlosigkeit.

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Die wichtigsten Nachrichten direkt in Ihre Mailbox. Sie können bis zu 5 Newsletter gleichzeitig auswählen Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.