https://www.faz.net/-gum-3egt

Interview : „Selbst Bill Gates hat sich für Verbmobil interessiert“

  • Aktualisiert am

Zukunftspreisträger Wahlster Bild: dpa

Wolfgang Wahlster hat für sein „Verbmobil“ den Deutschen Zukunftspreis bekommen. Ein FAZ.NET-Interview.

          3 Min.

          In Science-Fiction-Filmen ist es üblich, dass die Menschen mit ihren Maschinen reden. Wolfgang Wahlster, Direktor des Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) in Saarbrücken, versucht seit Jahren mit seiner Forschung zu erreichen, dass diese Szenarien real werden. Für sein Verbmobil bekam er den Deutschen Zukunftspreis. Wahlsters neuester Coup sind sprachgesteuerte Fernseher, erzählt er im FAZ.NET-Interview.

          Wozu sind Spracherkennungssysteme überhaupt nötig?

          Wir wollen die Bedienung von Computern stark vereinfachen. Heutzutage haben zum Beispiel ältere Menschen immer noch Probleme im Umgang mit ihnen. Deshalb brauchen wir sprachverstehende Computer. Damit kann jeder ohne Vorkenntnisse und ohne Tastatur und Maus einen Computer bedienen. Es ist essenziell für die Informationsgesellschaft, dass wir allen Bürgern den Zugang zum Internet ermöglichen. Und dafür ist die Alltagsprache das beste Mittel, weil sie jeder beherrscht.

          Warum hat es dreißig Jahre gedauert, bis so viele Hindernisse aus dem Weg geräumt waren, dass ein Computer Sprache verstehen kann?

          Die automatische Erkennung und das Verstehen von Sprache ist ungeheuer schwierig. Wir brauchten zum Beispiel sehr viel Zeit, um viele verschiedene Stimmtypen und Aussprachevarianten zu analysieren und computergerechte Grammatiken zu entwickeln. Das liegt unter anderem daran, dass das Sprachsignal so stark variiert. Wir können in der Alltagssprache ein und den gleichen Sachverhalt auf sehr viele Arten formulieren. Das ist der Vorteil der zwischenmenschlichen Kommunikation, denn dort muss man nicht wie bei der bisher üblichen Computernutzung genau ein Kommando oder eine bestimmte Tastenkombination lernen, um eine Aktion auszulösen. Diese positive Vielfalt des sprachlichen Ausdrucks ist aber eine der größten Schwierigkeiten bei Sprachverarbeitungssystemen.

          War die Entwicklung und Präsentation des Verbmobil-System der bisherige Höhepunkt der sprachverstehenden Systeme?

          Ja. Verbmobil ist das erste voll funktionsfähige System, das alle nötigen Verarbeitungskomponenten vereint: die Vorverarbeitung des Sprachsignals, Spracherkennung, Analyse, Verstehen, Übersetzen und schließlich die Generierung und die Sprachsynthese. Dadurch hat man auch zum ersten Mal ein Modell realisiert, wie die einzelnen Komponenten zusammenspielen und wie sie ineinander greifen. Verbmobil hat weltweit in der Fachwelt für großes Aufsehen gesorgt. Selbst Bill Gates hat sich für Verbmobil interessiert und es von seinen Entwicklungsleitern im Detail analysieren lassen.

          Wo liegen die Grenzen bei der digitalen Verarbeitung von Sprache?

          Es gibt dann eine klare Grenze, wenn der Computer sprachlich vermittelte Emotionen nicht nur erkennen, sondern auch empfinden soll, um sie dann wiederum in eine Fremdsprache zu überführen. Dies halte ich für eine unüberwindbare Grenze. Subtile Formen von Ironie, Sarkasmus oder Überheblichkeit in Geschäftsgesprächen festzustellen und diese dann beim Dolmetschen wiederzugeben, ist für sprachverstehende Computer nicht möglich. Den Erfahrungshintergrund, den jeder Mensch zusammen mit dem Spracherwerb aufgebaut hat, kann ein Computerprogramm nicht kompensieren.

          Eine zweite Grenze ist, dass ein Computer nur ein spezifisches Wissen über das Gebiet hat, in dem er etwas verstehen soll. Das so genannte Weltwissen eines Menschen ist aber viel breiter angelegt. Jeden einzelnen Wissensbereich einzuprogrammieren, der in einem Dialog angesprochen werden könnte, ist aber zu aufwendig. Die heutigen Sprachsysteme sind daher immer begrenzt auf bestimmte Thematiken wie Börse, Wetter, Bahn oder Flugreservierung.

          Gibt es eine Sprache, die besonders schwierig ist für ein solches System?

          In der Spracherkennung ist Englisch eine der schwierigsten Sprachen. Die Engländer und Amerikaner benutzen sehr viele kurze Wörter, die dann bei gleicher Aussprache auch noch verschiedene Bedeutungen haben. Deutsch ist da schon erheblich besser. Deutsche werden zwar oft belächelt wegen ihrer vergleichsweise langen Wörter, aber gerade diese machen es für den Computer einfacher, die Wörter eindeutig zu erkennen. Es gibt tatsächlich enorme Unterschiede in den einzelnen Sprachen für die Computererkennung.

          Ist China mit einer Milliarde Sprechern ein attraktiver Markt für die Anwendung ihrer Forschung?

          In Japan und China besteht an der automatischen Übersetzung sehr großes Interesse, weil man dort aufgrund der Globalisierung verstärkt Kontakte zu Europäern und Amerikanern sucht und immer wieder die Sprachbarriere vorfindet. Für Asiaten sind solche Übersetzungsmaschinen also noch wichtiger als für Europäer, wo man mit Englisch fast überall durchkommt. Trotzdem werden wir in China nicht so schnell kommerziell Fuß fassen können, weil sich dort nur ein sehr kleiner Prozentsatz der Bevölkerung solch ein Sprachsystem leisten kann.

          Wie sieht der Markt in Europa aus?

          In Europa haben wir gute Chancen auf dem Markt für Sprachtechnologie und Sprachforschung die Nase vorne zu haben. Die Mobile Telephonie, die in Europa am stärksten verbreitet ist, stellt eine besondere Einsatzmöglichkeit für die Sprachtechnologie dar. Mit UMTS werden wir eine neue Welle mobiler Internet-Anwendungen erleben, da wir so viele verschiedene Dienste über Handy abrufen können, dass wir da ohne Sprachsteuerung gar nicht mehr auskommen werden.

          Trotz der Errungenschaften der Künstlichen Intelligenz gibt es genügend Skeptiker, weil diese befürchten, die Maschinen könnten uns irgendwann beherrschen. Was entgegnen sie solchen Zweiflern?

          Wir sind sehr weit davon entfernt, dass uns Maschinen dominieren können. So dumm ist der Mensch nicht, dass er sich von Artefakten, die er selbst schafft, dominieren lässt. Davon schreiben nur Science Fiction-Autoren. Wir werden dies in den nächsten hundert Jahren nicht erleben, und wir wollen es natürlich auch nicht. Außerdem haben wir jederzeit die Möglichkeit, die Computer zu stoppen und die Softwareprogramme zu beenden, wenn sie wirklich mal „ausrasten“ sollten.

          Weitere Themen

          Erster aktiver Football-Profi outet sich Video-Seite öffnen

          „Hey, I'm gay“ : Erster aktiver Football-Profi outet sich

          Der 28-Jährige betonte, er habe sich das schon so lange von der Seele reden wollen. Er hoffe, dass Videos wie seines eines Tages unnötig sein werden. Nassib ist der erste aktive Spieler der NFL, der offen von seiner Homosexualität spricht.

          Topmeldungen

          Das Wahlplakat der Grünen

          #Allesistdrin : Die schöne Welt mit Lastenrad

          Ein Wahlplakat der Grünen zeigt eine vierköpfige Familie, die mit einem Lastenfahrrad durchs Grüne fährt. Und es zeigt ein Problem, das die Partei in ihrer Ansprache hat.
          Am 17. Februar im libyschen Benghazi: Frauen halten Landesfahnen hoch, um den 10. Jahrestag des Arabischen Frühlings in Libyen zu feiern, der zum Sturz des damaligen Gewaltherrschers Gaddafi führte.

          Hilfe für Libyen : Zwischen Wahl und Warlords

          Bisher hält der Waffenstillstand in Libyen. Nun soll eine weitere Konferenz in Berlin die Stabilisierung des Landes voranbringen. Doch nicht jeder Akteur hat daran ein Interesse.

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Abonnieren Sie unsere FAZ.NET-Newsletter und wir liefern die wichtigsten Nachrichten direkt in Ihre Mailbox. Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.