https://www.faz.net/-1v0-72qrj

Spracherkennung für Computer : Der Drache und seine schärfsten Rivalen

Der neue Drachen bringt ein abermals verbessertes akustisches Modell mit, das nun Best Match V heißt. Dieses verlangt einen Mehrkernprozessor und mindestens 4 Gigabyte Arbeitsspeicher. Wir probierten Dragon 12 mit einem älteren Core-2-Duo-PC und zwei Gigabyte Speicher. Hier wurde uns Best Match IV empfohlen, wir nahmen trotzdem das neue Akustikmodell - und die Arbeitsgeschwindigkeit brach deutlich ein. Wer Höchstleistungen sucht, benötigt also einen aktuellen Rechner. Mit dem Core-i5 und 8 Gigabyte Arbeitsspeicher hatten wir keine Probleme. Das neue Best-Match-Modell soll um bis zu 18 Prozent verbesserte Erkennungsleistung bieten, sagt das Marketing von Nuance, eine saloppe Formulierung, die man jedoch so nicht stehen lassen kann.

Genauigkeit bei bis zu 99 Prozent

Berücksichtigt man, dass eine Spracherkennung nur jene Begriffe fehlerfrei umsetzen kann, die in ihrem Vokabular gespeichert sind, hängt die Beurteilung von den Texten und den Inhalten ab. Eine prägnante Zusammenfassung der Art „98 Prozent Genauigkeit“ ist also unsinnig. Ein Arzt, Anwalt oder Gutachter, der für seine Diktate ein begrenztes Fachvokabular verwendet und dies sinnvollerweise gleich mit Dragon dazukauft, erreicht spielend 99 Prozent und mehr. Ein Dragon-Nutzer mit einem reichhaltigen und ungewohnten Vokabular, sagen wir ein Schriftsteller oder Journalist, wird darunter liegen. Er wird vermutlich eigene Ad-hoc-Begriffe (wie diesen hier) verwenden und vielleicht nur einmal und dann nie wieder. Kein Wörterbuch kann da mithalten.

Wie gut die Erkennungsleistung von Dragon 12 im Vergleich mit der Vorgängerversion ist, haben wir also mit unseren eigenen Diktaten ermittelt, das ist eine subjektive Komponente im Test. Aber wir suchten reproduzierbare Ergebnisse. Deshalb wurde aus Hunderten von Diktiergerät-Aufzeichnungen im DSS-Pro-Format eine repräsentative Auswahl erstellt. Neben kurzen, knappen E-Mails auch längere mit privatem Inhalt, Nachrichtenmeldungen, das Protokoll einer Testfahrt im Auto, und spaßeshalber ein „abdiktierter“ wissenschaftlicher Aufsatz aus der DDR-Geschichtsschreibung in einer aus heutiger Sicht inakzeptablen Sprache.

Ein und dieselbe Diktatdatei ließen wir der Reihe nach erkennen, und zwar mit der alten und der neuen Version, so wie sie der Nutzer nach der Installation vorfindet (also ohne benutzerspezifische Anpassungen). Die Ergebnisse: Etwa jeder zehnte Fehler wurde ausgemerzt, die Genauigkeit liegt - je nach Text - bei bis zu 99 Prozent.

Die „Premium“-Variante sollte es mindestens sein

Vor zwei Jahren konnten wir bei der Vorstellung der Version 11 festhalten, dass die Fehlerrate halbiert wurde. Der Fortschritt schreitet also um so langsamer voran, je perfekter die Erkennung wird. Die typischen Probleme sind übrigens gleich geblieben: Groß- und Kleinschreibung, Getrennt- und Zusammenschreibung, Abkürzungen, Produkt- und Eigennamen bereiten noch immer Kopfzerbrechen. Aber mit der „richtigen“ Nutzung der Korrekturbefehle und zunehmender Adaption an das Nutzervokabular verschwindet mancher Fehler. Und mit ein bisschen Erfahrung kennt man im Laufe der Zeit die Stolpersteine und wird dann beispielsweise „ist vom Feinsten“ dahingehend diktieren, dass man dem „Feinsten“ das Kommando „groß“ voranstellt.

Eine häufige Fehlerklasse wurde indes ausgemerzt: Mit einer Option kann man Personalpronomen der 2. Person („Du“, „Dich“) immer groß schreiben lassen und mit einer weiteren kontextabhängig auch die der 3. Person („Sie“, „Ihnen“). Das ist ebenso ein Gewinn wie „Smart Format“, eine Funktion, die sich einmalige Korrekturen einer Schreibweise („Kilogramm“ statt „kg“) permanent merkt. Etliche kleinere Verbesserungen betreffen ferner die Steuerung eines E-Mail-Systems im Browserfenster, das zu diesem Zweck mit einer Erweiterung versehen sein muss.

Wie gehabt läuft Dragon 12 selbst mit Windows XP; zwei Gigabyte Arbeitsspeicher sind indes Pflicht. Die kleinste, nicht empfehlenswerte Version heißt „Home“ (für 100 Euro), die von uns erprobte „Premium“-Variante (150 Euro) sollte es mindestens sein. „Professional“ für 830 Euro und „Legal“ mit juristischem Fachvokabular (1070 Euro) runden das Angebot nach oben hin ab.

Topmeldungen

Wieder mehr USA-Flüge: Vor Corona waren sie Umsatzgarant für Lufthansa.

Grenzöffnung ab November : Wo die Tücken auf USA-Reisen liegen

Die Wirtschaft jubelt über die endlich angekündigte Grenzöffnung der USA. Doch für Touristen sind noch einige Fragen offen – zum Beispiel das Reisen mit Kindern. Die Probleme sind allerdings klein im Vergleich zu Reisen nach China.