https://www.faz.net/-gum-3egt

Interview : „Selbst Bill Gates hat sich für Verbmobil interessiert“

  • Aktualisiert am

Zukunftspreisträger Wahlster Bild: dpa

Wolfgang Wahlster hat für sein „Verbmobil“ den Deutschen Zukunftspreis bekommen. Ein FAZ.NET-Interview.

          In Science-Fiction-Filmen ist es üblich, dass die Menschen mit ihren Maschinen reden. Wolfgang Wahlster, Direktor des Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Saarbrücken, versucht seit Jahren mit seiner Forschung zu erreichen, dass diese Szenarien real werden. Für sein Verbmobil bekam er den Deutschen Zukunftspreis. Wahlsters neuester Coup sind sprachgesteuerte Fernseher, erzählt er im FAZ.NET-Interview.

          Wozu sind Spracherkennungssysteme überhaupt nötig?

          Wir wollen die Bedienung von Computern stark vereinfachen. Heutzutage haben zum Beispiel ältere Menschen immer noch Probleme im Umgang mit ihnen. Deshalb brauchen wir sprachverstehende Computer. Damit kann jeder ohne Vorkenntnisse und ohne Tastatur und Maus einen Computer bedienen. Es ist essenziell für die Informationsgesellschaft, dass wir allen Bürgern den Zugang zum Internet ermöglichen. Und dafür ist die Alltagsprache das beste Mittel, weil sie jeder beherrscht.

          Warum hat es dreißig Jahre gedauert, bis so viele Hindernisse aus dem Weg geräumt waren, dass ein Computer Sprache verstehen kann?

          Die automatische Erkennung und das Verstehen von Sprache ist ungeheuer schwierig. Wir brauchten zum Beispiel sehr viel Zeit, um viele verschiedene Stimmtypen und Aussprachevarianten zu analysieren und computergerechte Grammatiken zu entwickeln. Das liegt unter anderem daran, dass das Sprachsignal so stark variiert. Wir können in der Alltagssprache ein und den gleichen Sachverhalt auf sehr viele Arten formulieren. Das ist der Vorteil der zwischenmenschlichen Kommunikation, denn dort muss man nicht wie bei der bisher üblichen Computernutzung genau ein Kommando oder eine bestimmte Tastenkombination lernen, um eine Aktion auszulösen. Diese positive Vielfalt des sprachlichen Ausdrucks ist aber eine der größten Schwierigkeiten bei Sprachverarbeitungssystemen.

          War die Entwicklung und Präsentation des Verbmobil-System der bisherige Höhepunkt der sprachverstehenden Systeme?

          Ja. Verbmobil ist das erste voll funktionsfähige System, das alle nötigen Verarbeitungskomponenten vereint: die Vorverarbeitung des Sprachsignals, Spracherkennung, Analyse, Verstehen, Übersetzen und schließlich die Generierung und die Sprachsynthese. Dadurch hat man auch zum ersten Mal ein Modell realisiert, wie die einzelnen Komponenten zusammenspielen und wie sie ineinander greifen. Verbmobil hat weltweit in der Fachwelt für großes Aufsehen gesorgt. Selbst Bill Gates hat sich für Verbmobil interessiert und es von seinen Entwicklungsleitern im Detail analysieren lassen.

          Wo liegen die Grenzen bei der digitalen Verarbeitung von Sprache?

          Es gibt dann eine klare Grenze, wenn der Computer sprachlich vermittelte Emotionen nicht nur erkennen, sondern auch empfinden soll, um sie dann wiederum in eine Fremdsprache zu überführen. Dies halte ich für eine unüberwindbare Grenze. Subtile Formen von Ironie, Sarkasmus oder Überheblichkeit in Geschäftsgesprächen festzustellen und diese dann beim Dolmetschen wiederzugeben, ist für sprachverstehende Computer nicht möglich. Den Erfahrungshintergrund, den jeder Mensch zusammen mit dem Spracherwerb aufgebaut hat, kann ein Computerprogramm nicht kompensieren.

          Eine zweite Grenze ist, dass ein Computer nur ein spezifisches Wissen über das Gebiet hat, in dem er etwas verstehen soll. Das so genannte Weltwissen eines Menschen ist aber viel breiter angelegt. Jeden einzelnen Wissensbereich einzuprogrammieren, der in einem Dialog angesprochen werden könnte, ist aber zu aufwendig. Die heutigen Sprachsysteme sind daher immer begrenzt auf bestimmte Thematiken wie Börse, Wetter, Bahn oder Flugreservierung.

          Gibt es eine Sprache, die besonders schwierig ist für ein solches System?

          In der Spracherkennung ist Englisch eine der schwierigsten Sprachen. Die Engländer und Amerikaner benutzen sehr viele kurze Wörter, die dann bei gleicher Aussprache auch noch verschiedene Bedeutungen haben. Deutsch ist da schon erheblich besser. Deutsche werden zwar oft belächelt wegen ihrer vergleichsweise langen Wörter, aber gerade diese machen es für den Computer einfacher, die Wörter eindeutig zu erkennen. Es gibt tatsächlich enorme Unterschiede in den einzelnen Sprachen für die Computererkennung.

          Ist China mit einer Milliarde Sprechern ein attraktiver Markt für die Anwendung ihrer Forschung?

          In Japan und China besteht an der automatischen Übersetzung sehr großes Interesse, weil man dort aufgrund der Globalisierung verstärkt Kontakte zu Europäern und Amerikanern sucht und immer wieder die Sprachbarriere vorfindet. Für Asiaten sind solche Übersetzungsmaschinen also noch wichtiger als für Europäer, wo man mit Englisch fast überall durchkommt. Trotzdem werden wir in China nicht so schnell kommerziell Fuß fassen können, weil sich dort nur ein sehr kleiner Prozentsatz der Bevölkerung solch ein Sprachsystem leisten kann.

          Wie sieht der Markt in Europa aus?

          In Europa haben wir gute Chancen auf dem Markt für Sprachtechnologie und Sprachforschung die Nase vorne zu haben. Die Mobile Telephonie, die in Europa am stärksten verbreitet ist, stellt eine besondere Einsatzmöglichkeit für die Sprachtechnologie dar. Mit UMTS werden wir eine neue Welle mobiler Internet-Anwendungen erleben, da wir so viele verschiedene Dienste über Handy abrufen können, dass wir da ohne Sprachsteuerung gar nicht mehr auskommen werden.

          Trotz der Errungenschaften der Künstlichen Intelligenz gibt es genügend Skeptiker, weil diese befürchten, die Maschinen könnten uns irgendwann beherrschen. Was entgegnen sie solchen Zweiflern?

          Wir sind sehr weit davon entfernt, dass uns Maschinen dominieren können. So dumm ist der Mensch nicht, dass er sich von Artefakten, die er selbst schafft, dominieren lässt. Davon schreiben nur Science Fiction-Autoren. Wir werden dies in den nächsten hundert Jahren nicht erleben, und wir wollen es natürlich auch nicht. Außerdem haben wir jederzeit die Möglichkeit, die Computer zu stoppen und die Softwareprogramme zu beenden, wenn sie wirklich mal „ausrasten“ sollten.

          Weitere Themen

          Kommt eine große Koalition? Video-Seite öffnen

          Israel wählt das Patt : Kommt eine große Koalition?

          Die Wahl in Israel hat zu einer Patt-Situation im Parlament geführt: Prognosen zufolge liegen die Parteien von Ministerpräsident Benjamin Netanjahu und seines Herausforderers Benny Gantz fast gleichauf. Kann es schließlich doch zu einer großen Koalition kommen?

          Topmeldungen

          Das war nichts: Gegen Arsenal ist die Eintracht um Filip Kostic unterlegen.

          Heimdebakel in Europa League : Die Eintracht fällt auseinander

          Das mutige Auftreten gegen den FC Arsenal wird nicht belohnt: Zum Auftakt in die Europa League verlieren die Frankfurter zu Hause deutlich – und müssen in der nächsten Partie auf einen wichtigen Spieler verzichten.
          Signale des Bewusstseins, im Computer rekonstruiert: links ein fast bewusstloser Komapatient, rechts ein Gesunder, in der Mitte ein Komapatient mit Bewusstsein.

          Wegen Fehlverhaltens : Urteil gegen den Primus der Hirnforschung

          Der weltbekannte Hirnforscher Niels Birbaumer behauptet, Locked-In-Patienten wieder kommunikationsfähig zu machen. Jetzt hat ihn die DFG wegen Fehlverhaltens verurteilt. Er will trotzdem weitermachen.

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Abonnieren Sie unsere FAZ.NET-Newsletter und wir liefern die wichtigsten Nachrichten direkt in Ihre Mailbox. Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.