https://www.faz.net/-gy9-8l346

Spracherkennung Dragon 15 : Der versteht es

Fast fehlerfreie Spracherkennung für Windows Bild: Hersteller

Nuance bringt die nächste Version seiner Spracherkennungssoftware Dragon Naturally Speaking an den Start. Sie ist für den professionellen Einsatz gedacht. Wir haben mit ihr gesprochen.

          Wir hatten es unlängst in einem längeren Marktüberblick richtig vorausgesagt: Der amerikanische Hersteller Nuance bringt die nächste Version seiner Spracherkennungssoftware Dragon Naturally Speaking an den Start. Sie ist für den professionellen Einsatz gedacht. Im Unterschied zu Siri und ähnlichen Smartphone-Kollegen arbeitet ein solches Programm ohne Internetverbindung und ist lernfähig. Es lässt sich nicht nur um das eigene Vokabular ergänzen, sondern auch um die Eigenheiten der jeweils individuellen Aussprache. Wer mit einer solchen Software richtig umgeht, erhält von Tag zu Tag bessere Ergebnisse, weil beispielsweise Eigennamen oder oft verwendete Spezialbegriffe im Vokabular landen. Nun ist tatsächlich die neue Version 15 des Drachens im Handel, wir probierten die Variante Professional Individual für 400 Euro aus. Wer sparen will, warte bis die Premium mit der Kennziffer 15 erhältlich ist. Von der kleinsten Modellvariante Home raten wir indes ab.

          Michael Spehr

          Redakteur im Ressort „Technik und Motor“.

          Wie wir im August geschrieben hatten, arbeitet Dragon Naturally Speaking schon seit langem unter Windows fast fehlerfrei. Jedenfalls bei einem allgemeinen Wortschatz. Je komplexer das Vokabular und je mehr Fachbegriffe oder Eigennamen verwendet werden, desto kniffeliger wird die Sache. Typische Probleme sind ferner Groß- und Kleinschreibung, Getrennt- und Zusammenschreibung, Abkürzungen und Produktnamen. Die Angabe, dass von 100 diktierten Worten ein oder zwei falsch transkribiert werden, also die Genauigkeit bei 98 oder 99 Prozent liege, muss sinnvollerweise ergänzt werden um Hinweise zur Komplexität des Diktats. Denn fehlerfreie 100 Prozent sind bei einfachen Texten mühelos zu schaffen.

          Das Diktat bestand aus Alltagssprache

          Wir verglichen die neue 15 mit der älteren Professional 13 in folgendem Testverfahren: Zunächst wurde ein rund fünfminütiges Referenzdiktat mit einem hochwertigen Diktiergerät (Philips DPM 8000) aufgezeichnet. Das Diktat bestand aus Alltagssprache, aber auch etlichen kleinen Gemeinheiten, etwa Abkürzungen oder „Denglisch“ sowie Fachbegriffen. Das Diktat transkribierte zunächst die Version 13 auf einem Windows-10-Rechner mit Core-i7-Prozessor und 16 Gigabyte Arbeitsspeicher. Dann wurde das Vokabular der alten Software exportiert. Nur die Wortliste wohlgemerkt, nicht das Benutzerprofil mit der gespeicherten Aussprache.

          Anschließend wurde Version 13 deinstalliert und die neue 15 auf demselben Rechner eingerichtet. Das früher lange Sprechertraining beschränkt sich inzwischen auf wenige Sätze. Man kann also gleich loslegen. Wir importierten rund 500 Worte aus dem alten Vokabular und verzichteten auf das Angebot, deren Aussprache zu trainieren. Nach einer halben Stunde mit einem ersten Rundgang durch die Menüs musste dann Dragon 15 dasselbe Musterdiktat umsetzen. Beide Texte wurden verglichen. Das Ergebnis: Die neue Version 15 verstand uns auf Anhieb besser, etwa bei ähnlich klingenden Wortendungen. Wo die alte aus „gern “ ein „gerne“ machte und die „Foto-Community“ fälschlich in den Plural setzte, arbeitete die 15 fehlerfrei. Der Feinschliff ist also erkennbar. Beide Programme akzeptierten viel „Denglisch“, scheiterten aber an Raw-Formaten (daraus wurden Rohr-Formate) und Voip-Anrufen (Wort-Anrufen). Unser Ergebnis, für dieses eine Diktat: Das frisch aufgespielte Dragon 15 kam auf eine Genauigkeit von 99 Prozent, während Dragon 13, welches sich bereits zwei Jahre lang an unsere Eigenheiten gewöhnen konnte, 98,5 Prozent erreichte. Mit anderen Texten kann es andere Ergebnisse geben.

          Wir probierten die Software in sehr ruhiger Umgebung aus

          Die Besonderheit der neuen Version soll eine auf Mustererkennung basierende Deep-Learning-Technik sein, die Stimmmuster, Dialekte und Akzente besser erfasse und sich zudem auch für die Akustik von Großraumbüros eigne. Dies werden wir beobachten. Wir probierten die Software in sehr ruhiger Umgebung aus. Wie gehabt erlaubt die Variante Professional Individual eine geräteübergreifende Nutzung des eigenen Vokabulars. Es wird in der Cloud gespeichert und automatisch mit verschiedenen Geräten synchronisiert. Was am Rechner ergänzt wurde, steht also auch in der Diktat-App fürs Smartphone während der mobilen Texterfassung zur Verfügung. Dieser Komfort, den der Hersteller Dragon Anywhere nennt, verlangt zusätzlich ein Abonnement für 200 Euro im Jahr oder 20 Euro im Monat.

          Neu in Version 15 ist zudem die Option, dass bei der Umsetzung einer Audiodatei die Satzzeichen automatisch eingefügt werden. Für den Spracherkennungs-Profi, der stets Punkt und Komma mitspricht, ist das sehr ungewöhnlich, basiert doch die Kunst des Diktierens gerade darauf, den Text damit zu strukturieren. Dragon 15 fügt indes nur Punkt und Komma ein, keinen Gedankenstrich, keinen Doppelpunkt und natürlich auch keinen neuen Absatz. Diese Funktion hat also etwas Experimentelles, und die Ergebnisse sind interessant, aber noch nicht zufriedenstellend. Geübte Dragon-Nutzer werden also weiterhin die Interpunktionszeichen vollständig diktieren. Indes deutet sich mit dieser Funktion an, dass die amerikanische Software demnächst in der Lage sein könnte, natürlich sprachliche Texte noch besser zu erfassen - und vor allen Dingen auch Interviews zu transkribieren. Dazu müsste allerdings neben der Interpunktion noch eine zweite Hürde fallen, nämlich die Verwendung von nutzerspezifischen Sprachprofilen, wenn mehrere Menschen im Interview reden und sich gegebenenfalls ins Wort fallen.

          Weitere Themen

          Samsung präsentiert faltbares Smartphone Video-Seite öffnen

          Galaxy Fold : Samsung präsentiert faltbares Smartphone

          Smartphone und Tablet in einem: Als erster großer Hersteller präsentiert Samsung ein faltbares Mobilgerät. Mit dem Galaxy Fold wollen die Südkoreaner zeigen, dass der hart umkämpfte Smartphone-Markt immer noch für Innovationen gut ist.

          Smartphone, 2000 Euro, faltbar

          Samsung Galaxy Fold : Smartphone, 2000 Euro, faltbar

          Nun ist es wirklich da. Samsung hat das erste faltbare Smartphone in Serienreife vorgestellt. Es kommt Anfang Mai, kostet 2000 Euro und hat aufgeklappt einen Bildschirm, der fast so groß ist wie das iPad Mini.

          Imposante Flugmanöver Video-Seite öffnen

          Präsentation von Neuheiten : Imposante Flugmanöver

          Bei der „Aero India“ in Bangalore zeigen militärische und zivile Luftfahrtindustrie ab Mittwoch, was sie zu bieten haben. Überschattet wurde die Messe von einem Unfall bei Übungen zur Flugschau.

          Topmeldungen

          Darf auch nach einem ungeregelten Brexit abheben: eine Maschine von Thomas Cook.

          Auch bei hartem Brexit : EU bannt Brexit-Risiken für Urlauberflüge

          Deutsche Touristen können aufatmen: Fluggesellschaften dürfen nach dem Willen der EU auch im Falle eines ungeregelten Brexits starten – zumindest für die folgenden sechs Monate. Ursprünglich hatte die Kommission deutlich striktere Regeln vorgeschlagen.
          Auf einem Campingplatz in Lügde sollen Kinder missbraucht worden sein.

          Verschwundene Beweise : Missbrauchsfall Lügde gerät zum Polizeiskandal

          Die Liste der Pannen bei den Ermittlungen im Missbrauchsfall Lügde wird immer länger. Erst jetzt wird bekannt, dass Beweismaterial aus der Polizeibehörde seit Wochen verschwunden ist. NRW-Innenminister Reul ist fassungslos. Die Polizei spricht von einer „Katastrophe“.
          Halt den Haller: Eintracht Frankfurt steht dank seines französischen Stürmers im Europa-League-Achtelfinale.

          4:1 gegen Donezk : Eintracht verlängert Europatour

          Erst souverän, dann zittrig, schließlich klar und deutlich: Frankfurt schlägt Donezk 4:1 und stürmt in die nächste Europapokalrunde. Hinten hilft die Torlatte, vorne treffen Jovic, Haller und Rebic.

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Abonnieren Sie unsere FAZ.NET-Newsletter und wir liefern die wichtigsten Nachrichten direkt in Ihre Mailbox. Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.