http://www.faz.net/-gy9-7te3a

Spracherkennung Dragon 13 : Endlich versteht uns der Computer perfekt

Das Ende der Tastatur? Das Sprachprogramm Dragon 13 (hier ein Screenshot) hat viele der Schwächen seiner Vorgänger verloren. Bild: Michael Spehr

Sprich doch mal mit dem PC: Dragon von Nuance ist der Stand der Technik in der Spracherkennung. Die neue Version 13 verblüfft selbst Fachleute. Ist das das Ende der Tastatur?

          Spracherkennung: Das war doch immer die Technik, die nicht perfekt funktionierte, oder? Jenseits mancher Anekdote zum Thema „Der PC bittet zum Diktat“ wissen die regelmäßigen Leser von „Technik und Motor“, dass Spracherkennung in den vergangenen Jahren immer besser geworden ist. Zumindest die Standardsoftware Dragon Naturally Speaking vom amerikanischen Hersteller Nuance, die ihren wenigen Konkurrenten weit voraus ist. Aber der Drachen aus Amerika war nie einfach zu bändigen. Für die letzten Raffinessen musste man ein Spracherkennungsspezialist werden, so wie es früher Experten für Textverarbeitung gab.

          Michael Spehr

          Redakteur im Ressort „Technik und Motor“.

          Jetzt ist alles anders: Dragon Naturally Speaking macht zwar nur einen kleinen Sprung in der Versionsnummer von der Ziffer 12.5 auf die 13, der Fortschritt ist jedoch sofort zu sehen. Mit diesem Windows-Programm ist die Spracherkennung nun angekommen. Sie funktioniert so gut und perfekt wie in der Werbung. Ja, der PC versteht einen. Wer diktieren will, weil es stets schneller geht als das Schreiben mit der Tastatur, und wer diktieren muss, weil er ein Handicap hat, der macht mit dem neuen Drachen nichts verkehrt.

          Dragon 13 ist in vielerlei Hinsicht anders als seine Vorgänger. Schon bei der Einrichtung nach der Programminstallation: Die zur Verfügung stehenden Mikrofone sind nun übersichtlich aufgeführt, und erstmals unterstützt das Programm die eingebauten Mikrofone eines Notebooks, vorausgesetzt, ihre Audioqualität ist hinreichend, das wird geprüft.

          So bequem war ein Sprachprogramm noch nie

          In der Regel klappt das, man kann selbst aus größerer Entfernung diktieren. Einer unserer Kollegen nutzt seitdem als Diktiermikrofon seine Web-Cam und zum Ein- und Ausschalten des Mikros einen Fußschalter. Darauf muss man erst mal kommen.

          Zweitens ist das obligatorische Übungsdiktat bei der Einrichtung des Drachens nun drastisch reduziert worden. Man muss nur noch ein paar Sätze diktieren, schon wird das eigene Nutzerprofil erstellt. So einfach und bequem hat man es noch nie gehabt. Sodann die Bedienungsoberfläche: Die gewohnte Menüleiste, die permanent und frei verschiebbar an einem der Bildschirmränder andockt, lässt sich jetzt in einer modernisierten Form als Dragon-Leiste so einrichten, dass sie sich bei Nichtgebrauch automatisch kleinmacht und diskret in den Hintergrund schiebt.

          Aus Becker Tüte wird Bäckertüte

          Doch wie sieht es bei der Funktionalität und vor allen Dingen bei der Erkennungsgenauigkeit aus? Der Hersteller Nuance lobt, die neue Version sei „bis zu 13 Prozent genauer“. Da schon die Vorgängerin eine Genauigkeit von bis zu 99 Prozent erreichte, fragt man sich natürlich sofort, wie hier gerechnet wird. Wir haben Referenzdiktate, die mit einem Diktiergerät aufgezeichnet wurden, zunächst unserer bis dahin eingesetzten Dragon-12.5-Version mit gut trainiertem Sprachprofil vorgesetzt. Anschließend wurde die Software gelöscht, das junge Dragon 13 installiert, ein neues Benutzerprofil angelegt und abermals die Transkription auf den Weg gebracht.

          Wir hatten zu Beginn des Experiments mit minimalen Verbesserungen gerechnet - und waren schnell aus dem Häuschen. Dragon 12.5 war schon verflixt gut, aber die neue Version 13 macht es noch einmal deutlich besser, da ist die „Bäckertüte“ richtig erkannt (12.5 schrieb: „Becker Tüte“) und bei den vertrackten Kleinigkeiten, etwa undeutlich ausgesprochenen Wortendungen („ein“ statt „einem“) ist die Fehlerrate geradezu verblüffend reduziert.

          Der Drache merkt sich sprachliche Eigenheiten

          Eine weitere Beobachtung: Wer sehr deutlich spricht, hatte schon immer bei Dragon die Nase vorn. Die neue Version ist viel fehlertoleranter geworden, sie bügelt etliche Ungenauigkeiten von allein aus, sehr faszinierend. Die typischen Probleme sind wie gehabt Groß- und Kleinschreibung, Getrennt- und Zusammenschreibung, Abkürzungen, Produkt- und Eigennamen. Die Fehler lassen sich dem Drachen austreiben, dazu muss man sich ein wenig mit den Korrekturoptionen beschäftigen. Wie in der Vorgängerversion ist das jedoch leicht geworden, etwa mit „Smart Format“, einer Funktion, die sich einmalige Korrekturen einer Schreibweise („Kilogramm“ statt „kg“) permanent merkt.

          Nicht zuletzt staunten wir bei der Integration in andere Anwendungen und Web-Browser. Bei allen Vorgängerversionen konnte man gut in Word oder Excel diktieren, aber schon die E-Mail im Fenster von Googlemail war eine Herausforderung. Nun unterstützt das neue Dragon Aria. Das sind, so die Abkürzung, Accessible Rich Internet Applications der Web Accessibility Initiative, die sich Wai schreibt.

          Premium statt Home-Version

          Mit Aria werden Websites und Webanwendungen für behinderte Menschen besser zugänglich, und mit Dragon ist nun eine sehr ordentliche Navigation auf Internetseiten und in Internetanwendungen möglich, sofern man die entsprechenden Befehle wie „Klick“, „Nimm“ und „Tabulatortaste“ einsetzt.

          Dragon 13 ist deutlich schneller geworden, bleibt aber bei den Systemvoraussetzungen bescheiden. Zwei Gigabyte Ram benötigt die 32-Bit-Version, die 64-Bit-Variante will das Doppelte. Von Windows 7 an werden alle Microsoft-Betriebssysteme unterstützt. Wichtig ist wie immer ein möglichst flinker Prozessor, wenngleich Nuance einen Intel Dual Core als Mindestvoraussetzung angibt. Die von uns geprüfte Premium-Version kostet 170 Euro, die kleinere namens Home lohnt sich nicht.

          Wer professionell mit Dragon arbeiten will oder ein Fachvokabular benötigt, etwa als Arzt oder Anwalt, muss auf die Varianten Professional, Medical oder Legal ausweichen, die deutlich teurer sind und im Herbst als Version 13 kommen. Die Premium ist indes derzeit für alle Standardanwendungen eine gute Wahl, das Update von früheren Versionen lohnt in jedem Fall. Interviews kann Dragon noch nicht transkribieren, es muss ja noch ein Ziel für die Version 14 geben.

          Weitere Themen

          Wissenschaft mit Technik statt Tierversuchen Video-Seite öffnen

          Nach Skandal : Wissenschaft mit Technik statt Tierversuchen

          Deutsche Autobauer wie VW oder Daimler ließen Affen stundenlang Abgase einatmen, um zu zeigen, dass die Gase sauber sind. Auch in anderen Branchen wie der Pharmazeutik werden Tests an Tieren gemacht. Muss das noch so sein?

          Chinesischen Forschern gelingt Durchbruch Video-Seite öffnen

          Klon-Technik : Chinesischen Forschern gelingt Durchbruch

          „Zhong Zhong“ und „Hua Hua“ sind die ersten Affen die in China durch Kerntransfer geklont wurden. Sie sind gesund zur Welt gekommen und haben die ersten 10 Wochen überlebt. Es wurde die gleiche Technik wie beim Schaf Dolly vor 22 Jahren verwendet.

          Topmeldungen

          Peter Tauber hört als CDU-Generalsekretär auf

          CDU-Generalsekretär Tauber : Am Ende fehlte ihm die Autorität

          Den einen war er zu konservativ, den anderen zu modern: Nach vier Jahren im Amt als CDU-Generalsekretär hört Peter Tauber auf. Kanzlerin Merkel könnte schon morgen einen Nachfolger vorschlagen.

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Abonnieren Sie unsere FAZ.NET-Newsletter und wir liefern die wichtigsten Nachrichten direkt in Ihre Mailbox. Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.