Home
http://www.faz.net/-gyc-yjpg
HERAUSGEGEBEN VON WERNER D'INKA, BERTHOLD KOHLER, GÜNTHER NONNENMACHER, HOLGER STELTZNER

Dragon Naturally Speaking 11 Diktieren ist viel schneller als Tippen

Nuance bringt Dragon Naturally Speaking 11 auf den Markt. Das vielfach verbesserte Programm ist der Maßstab schlechthin unter den Spracherkennungsprogrammen. Vielschreiber erfassen Texte dreimal schneller als mit der Tastatur.

© Screenshot Nuance Vergrößern Einfach den Computer mit Sprache steuern: Mit Dragon Naturally Speaking 11

Nach ungefähr zwei Stunden stellen sich die ersten Aha-Effekte ein, und dann kommt man aus dem Staunen nicht mehr heraus. Dass man sich nicht nur oberflächlich mit dieser Software beschäftigen muss und eine gewisse Übung benötigt - das ist der größte Nachteil der Spracherkennung am Computer. Wir haben es in den vergangenen Jahren immer wieder erlebt: Wer mit der Technik allein herumexperimentiert, ungeduldig ist und elementare Regeln missachtet, gibt nach kurzer Zeit auf. Wer jedoch Spracherkennung bei einem erfahrenen Benutzer im praktischen Einsatz sieht, will sie haben, die Faszination ist groß.

Spracherkennung wird von Jahr zu Jahr besser, derzeit hat sie ihren Durchbruch auf den modernen Smartphones. Mit dem offenen Betriebssystem Android in der aktuellen Variante 2.2 und mit dem iPhone von Apple kann man SMS und andere Nachrichten diktieren, die passenden „Apps“ vorausgesetzt. Die beste und zuverlässigste Lösung mit hoher Erkennungsrate ist „Dragon Dictation“ für das iPhone. Das Mini-Programm steht gratis parat, der Hersteller Nuance will damit für seine PC-Spracherkennung Dragon Naturally Speaking werben. Dass dies gelingt, zeigt die Plazierung der App als eine der meistgeladenen in Apples Online-Geschäft.

Mehr zum Thema

Nun bringt Nuance seine Windows-Software in der Version 11 auf den Markt und zeigt, was sich in den vergangenen zwei Jahren getan hat: Das vielfach verbesserte Programm ist der Maßstab, es gibt keine andere Software mit vergleichbarer Leistungsfähigkeit, man mag diese Monopolstellung bedauern. Wir haben den neuen Drachen zunächst an seiner Erkennungsleistung gemessen: Wie viel Prozent der Worte werden richtig erkannt?

Er wird vermutlich eigene Ad-hoc-Begriffe verwenden

Das hört sich trivial an, ist es aber nicht. Berücksichtigt man, dass eine Spracherkennung nur jene Begriffe fehlerfrei umsetzen kann, die in ihrem Vokabular gespeichert sind, hängt die Beurteilung von den Texten und Inhalten ab. Eine prägnante Zusammenfassung der Art „98 Prozent Genauigkeit“ ist also unsinnig. Ein Arzt, Anwalt oder Gutachter, der für seine Diktate ein begrenztes Fachvokabular verwendet und dies sinnvollerweise gleich mit Dragon dazukauft, erreicht spielend 99 Prozent und mehr. Ein Nutzer mit einem reichhaltigen Vokabular, sagen wir ein Schriftsteller oder Journalist, wird eher bei 97 Prozent liegen. Er wird vermutlich eigene Ad-hoc-Begriffe (wie diesen hier) verwenden und vielleicht nur einmal und dann nie wieder. Kein Wörterbuch kann da mithalten.

Wie gut die Erkennungsleistung von Dragon 11 im Vergleich mit der Vorgängerversion 10 ist, haben wir mit unseren eigenen Diktaten ermittelt, das ist eine subjektive Komponente im Test. Aber wir suchten reproduzierbare Ergebnisse. Deshalb wurde aus Hunderten von Diktiergerät-Aufzeichnungen im DSS-Pro-Format eine Auswahl erstellt. Neben kurzen, knappen E-Mails auch längere mit privatem Inhalt, Nachrichtenmeldungen, ein Protokoll einer Testfahrt im Auto und spaßeshalber ein wissenschaftlicher Aufsatz aus der DDR-Geschichtsschreibung in einer aus heutiger Sicht merkwürdigen Sprache. Ein und dieselbe Diktat-Datei ließen wir der Reihe nach erkennen, und zwar mit der alten und der neuen Version, so wie sie der Nutzer nach der Installation vorfindet (also ohne benutzerspezifische Anpassungen). Die Ergebnisse: Die Fehlerrate ist in etwa halbiert, die Genauigkeit liegt - je nach Text - bei bis zu 99 Prozent, ein vorzügliches Ergebnis. Es fußt auf zwei Verbesserungen: Zum einen ist das Vokabular mehr als doppelt so groß. Rund 300 000 Einträge zählt das „Bestmatch IV“ der aktuellen Version, 135 000 waren es bei „Bastmatch III“ in Dragon 10. Zum anderen wurde die Abtastrate des Mikrofons von 11 auf 22 Kilohertz ebenfalls verdoppelt, und so verschwinden viele Probleme mit undeutlich gesprochenen Wortendungen quasi von allein.

1 | 2 Nächste Seite   |  Artikel auf einer Seite
 
 ()
   Permalink
 
 
 

Hier können Sie die Rechte an diesem Artikel erwerben

Knackfrisch

Von Holger Appel

Alle Autohersteller wollen auf den ersten Platz. Auf den ersten in der Zulassungsstatistik, auf den besten in der Pannenstatistik. Nur auf eine Spitzenposition verzichten sie gern. Mehr 1