http://www.faz.net/-gy9-7te3a
HERAUSGEGEBEN VON WERNER D'INKA, JÜRGEN KAUBE, BERTHOLD KOHLER, HOLGER STELTZNER
F+ Icon
F.A.Z. PLUS
abonnieren

Veröffentlicht: 11.09.2014, 09:44 Uhr

Spracherkennung Dragon 13 Endlich versteht uns der Computer perfekt

Sprich doch mal mit dem PC: Dragon von Nuance ist der Stand der Technik in der Spracherkennung. Die neue Version 13 verblüfft selbst Fachleute. Ist das das Ende der Tastatur?

von
© Michael Spehr Das Ende der Tastatur? Das Sprachprogramm Dragon 13 (hier ein Screenshot) hat viele der Schwächen seiner Vorgänger verloren.

Spracherkennung: Das war doch immer die Technik, die nicht perfekt funktionierte, oder? Jenseits mancher Anekdote zum Thema „Der PC bittet zum Diktat“ wissen die regelmäßigen Leser von „Technik und Motor“, dass Spracherkennung in den vergangenen Jahren immer besser geworden ist. Zumindest die Standardsoftware Dragon Naturally Speaking vom amerikanischen Hersteller Nuance, die ihren wenigen Konkurrenten weit voraus ist. Aber der Drachen aus Amerika war nie einfach zu bändigen. Für die letzten Raffinessen musste man ein Spracherkennungsspezialist werden, so wie es früher Experten für Textverarbeitung gab.

Michael Spehr Folgen:

Jetzt ist alles anders: Dragon Naturally Speaking macht zwar nur einen kleinen Sprung in der Versionsnummer von der Ziffer 12.5 auf die 13, der Fortschritt ist jedoch sofort zu sehen. Mit diesem Windows-Programm ist die Spracherkennung nun angekommen. Sie funktioniert so gut und perfekt wie in der Werbung. Ja, der PC versteht einen. Wer diktieren will, weil es stets schneller geht als das Schreiben mit der Tastatur, und wer diktieren muss, weil er ein Handicap hat, der macht mit dem neuen Drachen nichts verkehrt.

Dragon 13 ist in vielerlei Hinsicht anders als seine Vorgänger. Schon bei der Einrichtung nach der Programminstallation: Die zur Verfügung stehenden Mikrofone sind nun übersichtlich aufgeführt, und erstmals unterstützt das Programm die eingebauten Mikrofone eines Notebooks, vorausgesetzt, ihre Audioqualität ist hinreichend, das wird geprüft.

So bequem war ein Sprachprogramm noch nie

In der Regel klappt das, man kann selbst aus größerer Entfernung diktieren. Einer unserer Kollegen nutzt seitdem als Diktiermikrofon seine Web-Cam und zum Ein- und Ausschalten des Mikros einen Fußschalter. Darauf muss man erst mal kommen.

Mehr zum Thema

Zweitens ist das obligatorische Übungsdiktat bei der Einrichtung des Drachens nun drastisch reduziert worden. Man muss nur noch ein paar Sätze diktieren, schon wird das eigene Nutzerprofil erstellt. So einfach und bequem hat man es noch nie gehabt. Sodann die Bedienungsoberfläche: Die gewohnte Menüleiste, die permanent und frei verschiebbar an einem der Bildschirmränder andockt, lässt sich jetzt in einer modernisierten Form als Dragon-Leiste so einrichten, dass sie sich bei Nichtgebrauch automatisch kleinmacht und diskret in den Hintergrund schiebt.

Aus Becker Tüte wird Bäckertüte

Doch wie sieht es bei der Funktionalität und vor allen Dingen bei der Erkennungsgenauigkeit aus? Der Hersteller Nuance lobt, die neue Version sei „bis zu 13 Prozent genauer“. Da schon die Vorgängerin eine Genauigkeit von bis zu 99 Prozent erreichte, fragt man sich natürlich sofort, wie hier gerechnet wird. Wir haben Referenzdiktate, die mit einem Diktiergerät aufgezeichnet wurden, zunächst unserer bis dahin eingesetzten Dragon-12.5-Version mit gut trainiertem Sprachprofil vorgesetzt. Anschließend wurde die Software gelöscht, das junge Dragon 13 installiert, ein neues Benutzerprofil angelegt und abermals die Transkription auf den Weg gebracht.

Wir hatten zu Beginn des Experiments mit minimalen Verbesserungen gerechnet - und waren schnell aus dem Häuschen. Dragon 12.5 war schon verflixt gut, aber die neue Version 13 macht es noch einmal deutlich besser, da ist die „Bäckertüte“ richtig erkannt (12.5 schrieb: „Becker Tüte“) und bei den vertrackten Kleinigkeiten, etwa undeutlich ausgesprochenen Wortendungen („ein“ statt „einem“) ist die Fehlerrate geradezu verblüffend reduziert.

Der Drache merkt sich sprachliche Eigenheiten

Eine weitere Beobachtung: Wer sehr deutlich spricht, hatte schon immer bei Dragon die Nase vorn. Die neue Version ist viel fehlertoleranter geworden, sie bügelt etliche Ungenauigkeiten von allein aus, sehr faszinierend. Die typischen Probleme sind wie gehabt Groß- und Kleinschreibung, Getrennt- und Zusammenschreibung, Abkürzungen, Produkt- und Eigennamen. Die Fehler lassen sich dem Drachen austreiben, dazu muss man sich ein wenig mit den Korrekturoptionen beschäftigen. Wie in der Vorgängerversion ist das jedoch leicht geworden, etwa mit „Smart Format“, einer Funktion, die sich einmalige Korrekturen einer Schreibweise („Kilogramm“ statt „kg“) permanent merkt.

Nicht zuletzt staunten wir bei der Integration in andere Anwendungen und Web-Browser. Bei allen Vorgängerversionen konnte man gut in Word oder Excel diktieren, aber schon die E-Mail im Fenster von Googlemail war eine Herausforderung. Nun unterstützt das neue Dragon Aria. Das sind, so die Abkürzung, Accessible Rich Internet Applications der Web Accessibility Initiative, die sich Wai schreibt.

Premium statt Home-Version

Mit Aria werden Websites und Webanwendungen für behinderte Menschen besser zugänglich, und mit Dragon ist nun eine sehr ordentliche Navigation auf Internetseiten und in Internetanwendungen möglich, sofern man die entsprechenden Befehle wie „Klick“, „Nimm“ und „Tabulatortaste“ einsetzt.

Dragon 13 ist deutlich schneller geworden, bleibt aber bei den Systemvoraussetzungen bescheiden. Zwei Gigabyte Ram benötigt die 32-Bit-Version, die 64-Bit-Variante will das Doppelte. Von Windows 7 an werden alle Microsoft-Betriebssysteme unterstützt. Wichtig ist wie immer ein möglichst flinker Prozessor, wenngleich Nuance einen Intel Dual Core als Mindestvoraussetzung angibt. Die von uns geprüfte Premium-Version kostet 170 Euro, die kleinere namens Home lohnt sich nicht.

Wer professionell mit Dragon arbeiten will oder ein Fachvokabular benötigt, etwa als Arzt oder Anwalt, muss auf die Varianten Professional, Medical oder Legal ausweichen, die deutlich teurer sind und im Herbst als Version 13 kommen. Die Premium ist indes derzeit für alle Standardanwendungen eine gute Wahl, das Update von früheren Versionen lohnt in jedem Fall. Interviews kann Dragon noch nicht transkribieren, es muss ja noch ein Ziel für die Version 14 geben.

No Noreply

Von Michael Spehr

Einer der fleißigsten E-Mail-Versender hat stets dieselbe Absenderadresse: Noreply. Er arbeitet zudem in unterschiedlichen und nahezu allen deutschen Unternehmen. Mehr 3 25

Zur Homepage