https://www.faz.net/-gy9-6vli6

iPhone 4S : Neue Möglichkeiten der Spracherkennung

Nach der Suchmaschine: Siri gibt Antworten. Bild: Spehr

Neu ist die Technik der Spracherkennung nicht – doch Apples System Siri gilt als Revolution auf dem Markt. Dabei machen sich die Entwickler simple Mechanismen zunutze.

          4 Min.

          "Alles spricht dafür, dass es Schokolade ist", antwortet Siri auf die Frage nach dem Sinn des Lebens. Wenn sie etwas gesprächiger ist, hört man auch: "Das ist einfach: Es ist eine philosophische Frage über den Zweck und die Bedeutung des Lebens oder der Existenz im Allgemeinen." Diese Anekdoten über die Sprachbedienung des neuen iPhone 4S machen derzeit die Runde. Siri gilt als Revolution, als tolle Erfindung aus dem Hause Apple. Aber was steckt wirklich dahinter?

          Michael Spehr
          Redakteur im Ressort „Technik und Motor“.

          Wenn es um die Erkennung von Sprache geht, darf man zunächst festhalten, dass die Technik nicht neu ist. Spracherkennung am PC gibt es seit mehr als zehn Jahren, für Smartphones seit mindestens fünf. Sie führte allerdings nur eine Nischenexistenz. Ärzte und Anwälte diktieren, weil es schneller geht als die manuelle Texteingabe. Zeit und Geld sind die wichtigste Motivation, sich mit einer Technik auseinanderzusetzen, die als sperrig gilt. Denn so locker und lässig wie mit Siri funktioniert das Ganze am PC nicht.

          Nicht nur Spielerei

          Es sind also bestimmte "Zutaten", mit denen Apple nun auftrumpft. Das sind an erster Stelle die kleinen Sperenzchen, wie etwa die Möglichkeit, nach der Wettervorhersage für eine bestimmte Stadt fragen zu können. Was nach Spielerei aussieht, hat jedoch Sinn. Es ist nicht nur der Kunstgriff des Anthropomorphismus, der Siri menschliche Eigenschaften zusprechen soll. Apple macht vor allem den Einstieg in eine Technik einfach, die für die meisten Nutzer fremd ist. Wie wichtig dieser saloppe Anfang ist, weiß man spätestens bei der Inbetriebnahme einer professionellen Software wie Dragon Naturally Speaking. Hier ist eine Hürde zu nehmen, nämlich das Erstellen eines persönlichen Benutzerprofils durch ein längeres Probediktat. Erst danach stellen sich Erfolgserlebnisse ein. Bei Siri ist es genau umgekehrt: Zunächst spielt man, dann entsteht der Wunsch nach "mehr".

          Semantische Analyse macht Siri effektiver als bisherige Erkennunssoftware
          Semantische Analyse macht Siri effektiver als bisherige Erkennunssoftware : Bild: Spehr

          Der zweite Vorzug der Apple-Lösung ist die semantische Analyse, die in der Tat als Alleinstellungsmerkmal gelten darf. Diktiert man einem neuen Windows-Smartphone "Neuer Termin übermorgen um 10 Uhr mit Max Muster", wird es unter guten Bedingungen das Gesagte fehlerfrei transkribieren und auf dem Display anzeigen. Aber es kann mit dem Inhalt nichts anfangen - und startet hilflos eine Internetsuche nach dem Text in Anführungszeichen. Kein besonders pfiffiges Verfahren. Siri hingegen erstellt einen Terminvorschlag mit dem Teilnehmer Max Muster und setzt das "übermorgen" automatisch in ein Kalenderdatum um.

          Auswertung wichtiger als wortgetreue Identifizierung

          Siri funktioniert zwar nur in gewissen Grenzen. Aber die inhaltliche Auswertung des Gesagten zeigt überdeutlich in eine Richtung, die traditionelle Spracherkenner bisher nur in Ansätzen genommen haben: Das Zulassen von Variabilität bei Eingaben und Kommandos. Damit wird der Vorhang aufgerissen für ganz neue Möglichkeiten der Spracherkennung. Herkömmliche Systeme fokussieren sich auf die Identifizierung des Gesagten, die möglichst hohe Erkennungsleistung steht im Vordergrund. Mit diesem Ansatz erzielt man wunderbare Ergebnisse bei der Erfassung von längeren Texten. Aber es gelingen einfachste Dinge nicht - oder nur auf Umwegen. Das Erstellen eines Outlook-Kalendereintrags in der übernächsten Woche am Mittwoch wird selbst der geübte Dragon-Experte an seinem PC nicht ohne Blick auf den Papierkalender absolvieren können. Denn der Drachen kann "übernächste Woche Mittwoch" nicht in ein Datumsformat umsetzen. Mit Siri wird die Übung dank semantischer Analyse zu einem Kinderspiel.

          Weitere Themen

          Das ist neu in Apples iOS 15

          Mobiles Betriebssystem : Das ist neu in Apples iOS 15

          Apple präsentiert an diesem Dienstag nicht nur neue Geräte, sondern auch die nächste Version seiner Betriebssysteme. Die Aktualisierungen kommen auf vorhandene iPhones, iPads und Apple Watches. Wir haben uns die neuen Versionen schon mal angeschaut.

          Topmeldungen

          Das französische U-Boot Shortfin Barracuda

          Australien zu U-Boot-Deal : „Wir haben unsere Bedenken geäußert“

          Paris wirft Canberra wegen eines geplatzten Rüstungsdeals „Doppelzüngigkeit“ vor. Der australische Außenminister weist den Vorwurf der Lüge jetzt entschieden zurück. Und auch die neue britische Außenministerin verteidigt den Deal.
          Der französische Schriftsteller Michel Houellebecq

          Michel Houellebecq : „Ich war süß und hübsch“

          In einer erstmals auf Deutsch veröffentlichten Tagebuchaufzeichnung aus dem Jahr 2005 schreibt der französische Schriftsteller über das Verhältnis zu seiner Mutter und darüber, wie es seine Beziehung zu Frauen prägte.
          Mann des Tages: Leroy Sané

          Bayern in Bierzeltstimmung : Volle Kanne Sané

          Statt Pfiffe und Häme wie zuletzt bekommt er plötzlich wieder Sonderapplaus: bei Bayerns Torfest gegen Bochum ist Leroy Sané der gefeierte Mann. Woher kommt der Wandel?

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Abonnieren Sie unsere FAZ.NET-Newsletter und wir liefern die wichtigsten Nachrichten direkt in Ihre Mailbox. Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.