http://www.faz.net/-gqe-76zy7
HERAUSGEGEBEN VON WERNER D'INKA, JÜRGEN KAUBE, BERTHOLD KOHLER, HOLGER STELTZNER

Veröffentlicht: 23.02.2013, 16:00 Uhr

Software von Nuance Jenseits der Spracherkennung

Die Spracherkennungs-Spezialisten von Nuance haben einen ersten Blick auf „Dragon TV“ erlaubt, das zur CES 2012 debütierte, aber noch nicht im Handel ist.

von
© Hersteller Sprich mit mir: Dragon TV mit dezenten Menüs hört in den Raum hinein

Gewiss würden wir gern mal mit unserem Fernsehgerät reden: „Suche bitte für Samstagabend ein öffentlich-rechtliches Programm ohne Volksmusik und Sponsoring.“ Man darf auf interessante Antworten gespannt sein. Eine Sprachsteuerung für TV-Geräte stand bislang nicht auf unserer Wunschliste erstrebenswerter Neuerungen im Wohnzimmer. Mit der herkömmlichen Fernbedienung kommt man schneller zum Ziel, wenn es um Basiskommandos wie den Senderwechsel oder die Einstellung der Lautstärke geht. Doch nun haben wir in der amerikanischen Zentrale des Spracherkennungs-Spezialisten Nuance einen ersten Blick auf „Dragon TV“ werfen dürfen, das zur CES 2012 debütierte, aber noch nicht im Handel ist.

Michael Spehr Folgen:

„Dragon“ spielt auf die PC-Software Dragon Naturally Speaking an, aber beim Reden mit dem Fernsehgerät ist alles anders: Es hört nämlich ständig in den Raum hinein, man muss nicht in ein Mikrofon sprechen, Hintergrundgeräusche werden ausgeblendet, und mit dem Zauberwort „Dragon TV“ wacht die Software aus dem Tiefschlaf auf und nimmt Kommandos entgegen. Und zwar Befehle in natürlicher Sprache, die weit über das hinausreichen, was sich flink mit einigen Tastendrucken auf der Fernbedienung erledigen lässt. Nicht nur, dass ein „Dragon TV, schalte um zur BBC“ oder „zeige die Senderliste“ zuverlässig ausgeführt wird. Man kann mit Sprachkommandos auch nach bestimmten Serien (“läuft gerade Criminal Minds“) oder Schauspielern (“gibt es etwas mit Harrison Ford heute Abend“) oder Genres (“welche Dokumentationen laufen gerade“) suchen lassen.

Ohne vorheriges Sprechertraining

In der Vorführung funktionierte das alles ohne vorheriges Sprechertraining mit einer kleinen Gruppe interessierter Journalisten einwandfrei. Der Clou sind jedoch einige Extras, die ihre Nähe zu Apples kluger Sprachassistentin Siri nicht leugnen können. Kein Wunder, wurde doch Siri von Nuance mitentwickelt. Wie Siri eine inhaltliche und semantische Analyse des Gesagten bietet, um mehr Variabilität bei Eingaben und Kommandos zu erlauben, soll auch Dragon TV als persönlicher Assistent zur Seite stehen. Pfiffig ist zum einen die übergreifende Steuerung sämtlicher Peripherie und Angebote rund ums Fernsehen. Die Nuance-Software steuert nämlich geräteübergreifend nicht nur den TV-Apparat, sondern auch den Receiver und den Festplattenrekorder. Alles ist miteinander verbunden, man kann nach „Dr. House“ suchen lassen, die Aufnahme auf der Festplatte veranlassen und sieht die Aufzeichnung im Ergebnisfenster der Suchfunktion. Zudem sind nicht zuletzt Streaming-Dienste eingebunden, in Amerika etwa die sehr populären Abo-Angebote von Netflix und Hulu.

Das Sahnehäubchen ist jedoch die Personalisierung bei unterschiedlichen Nutzern. Das System speichert individuelle Vorlieben, etwa Schauspieler oder Serien. Wie man bei Siri „rufe meine Schwester an“ sagen kann, lässt sich hier „kommt heute etwas mit meinem Lieblingsschauspieler“ erfragen. Und nicht zuletzt soll Dragon TV sogar diverse Plattformen unter einen Hut bekommen. Wer am PC mit der Dragon-Software nach einem in Japan spielenden Film mit Bill Murray gesucht und „Lost in Translation“ (etwa auf Netflix) gestartet hat, kann wenig später im Wohnzimmer das Filmvergnügen fortsetzen.

Mehr zum Thema

Nuance will über seinen bisherigen Kernbereich der Spracherkennung hinauswachsen und widmet sich wie Google und Apple den Inhalten. Persönliche Assistenten haben Zugriff auf die Daten des Nutzers, und an die Stelle der schlichten Erkennung einzelner Ausdrücke tritt eine umfangreiche Bedeutungsanalyse, die „erraten“ will, was der Nutzer gerade wünscht. Steht bei der reinen Spracherkennung die Genauigkeit im Vordergrund, rücken nun weitere Aspekte wie Effizienz, Integration, Tiefe und Portabilität ins Zentrum des Interesses. Portabilität heißt, dass abermals eigene Inhalte und Daten auf verschiedenen Geräten vorgehalten werden und sich Bediensysteme dem jeweiligen Kontext anpassen. Im Auto wird man anders mit seinem elektronischen Assistenten kommunizieren als im Büro, die Daten liegen stets in der Cloud. Die Frage bleibt nur, wie Nuance an die privaten Daten kommen will. Google und Apple haben es leichter, weil der Nutzer ohnehin seine Inhalte (Kontaktdaten, Kalendereinträge) in den jeweiligen Ökosystemen hinterlegt.

Jenseits von Dragon TV arbeitet Nuance mit ähnlichen Ansätzen in seiner Medizinsparte, die rund die Hälfte zum Umsatz beisteuert. Hier gibt es die Vision, dass eine im Patientengespräch mitlaufende Spracherkennung fortwährend aus Floskeln harte Fakten generiert, aus Erzählungen werden strukturierte Daten, die sich ohne Umschweife in medizinische Diagnosesysteme einspeisen lassen und dann beispielsweise darauf hinweisen, dass der Patient wegen seines am Rande erwähnten Diabetes ein bestimmtes Medikament nicht nehmen sollte.

Quelle: F.A.Z.

 

Hier können Sie die Rechte an diesem Artikel erwerben

Weitere Empfehlungen
Vier neue Gadgets Sony ist das Smartphone nicht genug

Das Handy ist die Zentrale unserer Kommunikation. Braucht man noch ein weiteres Gerät? Sony hat viele neue Ideen und will sich vom Smartphone lösen. Mehr Von Marco Dettweiler, Tokio

03.05.2016, 10:39 Uhr | Technik-Motor
Künstliche Intelligenz Facebook will Kunden mit Chatbots Zeit sparen

Auf der jährlichen Entwicklerkonferenz in San Francisco erläuterte Facebook-Chef Mark Zuckerberg sein Vorhaben, in Zukunft mehr auf Chatbots zu setzen: Roboterprogramme, mit denen der Nutzer über Textnachrichten kommunizieren kann. Am anderen Ende sitzt dann eine Maschine mit Spracherkennung und künstlicher Intelligenz. Mehr

13.04.2016, 14:36 Uhr | Wirtschaft
Diktiergerät von Philips Für smarte Bessersprecher

Revolution oder Spielerei? Philips verheiratet das Diktiergerät mit dem Smartphone. Was bringt es dem Profi? Erster Blick auf das neue Speech Air. Mehr Von Michael Spehr

05.05.2016, 08:08 Uhr | Technik-Motor
Video Schläge ins Nichts: Beats mit der Aerodrum

Ein Startup aus Liverpool hat ein Instrument entwickelt, mit dem man Schlagzeug spielen kann, ohne dabei eine Trommel zu berühren: Aerodrums. Eine Hochgeschwindigkeitskamera und spezielle Software machen es möglich. Mehr

09.04.2016, 10:10 Uhr | Gesellschaft
Carl Icahn vs. Apple Sind die Tech-Aktien in Schwierigkeiten?

Der einflussreiche New Yorker Hedgefondsmanager Carl Icahn verkauft sein Apple-Aktienpaket. Aber ist das wirklich ein schlechtes Zeichen für den weiteren Trend von Technologieaktien? Mehr Von Roland Lindner und Norbert Kuls, New York

30.04.2016, 11:49 Uhr | Finanzen