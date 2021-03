Aktualisiert am

Jan Peters ist Fachmann für Künstliche Intelligenz. Er sagt, was daraus folgt, dass Computer in immer mehr Spielen besser als Menschen werden – und was nicht.

Professor Peters, Forscher von Uber und OpenAi haben neue Algorithmen vorgestellt mit dem Namen „Go Explore“. Die können nun auch Computerspiele wie Montezuma’s Revenge besser als Menschen. Was ist da passiert?

Im Bereich der Atari-Spiele gab es vor acht Jahren einen Durchbruch dahin gehend, dass Künstliche Intelligenzen so ähnlich wie ein Mensch die Spiele auf dem Bildschirm wahrnehmen und direkt darauf basierend spielen lernten. Das gelang damals dem Unternehmen Deepmind. Die Lernalgorithmen erreichten gleich in enorm vielen Spielen menschliche Qualität und haben mitunter die besten Menschen geschlagen. Einige Spiele blieben indes unerreichbar schwer, etwa Montezuma’s Revenge.

Wieso?

Um zu einer Lösung zu gelangen, müssen Sie hier sehr viele Sachen ausprobieren, und zwar in Reihenfolge ausprobieren – wodurch die Anzahl der Möglichkeiten explodiert. Es bestehen zu viele Sackgassen mit langer Anfahrt, um alle Wege zu testen, das heißt, diese durchrechnen zu können.

Was ist anders an den neuen KIs?

Erstens ist eine Idee eingeflossen, die in der Robotik schon vor ungefähr 30 Jahren aufkam, um erfolgreiche Wege zu recyclen und nicht neu zu erforschen. Das klingt banal: Wenn ich einen guten Weg kenne, sollte ich diesen beibehalten können. Wenn der Agent also eine Art Weltmodell hat, kann er immer wieder zu vorherigen Anfangspunkten zurückkehren und dort anknüpfen.

Und zweitens?

Zusätzlich haben die Programmierer Vorwissen eingebracht, das die Algorithmen in diesen speziellen Atari-Spielen in die übermenschliche Liga katapultierte.

Was für ein Vorwissen ist das?

Die Forscher haben Vorwissen direkt aus der Darstellung des Spiels extrahiert. Dem Lernalgorithmus werden Merkmale verfügbar gemacht, die ihm die Auswahl der auszuprobierenden Möglichkeiten erleichtert – etwa die Positionen und die verfügbaren Werkzeuge der Spielfigur „Panama Joe“ zusammen mit einfachen Zusammenhängen wie der langfristigen Wichtigkeit einzelner Werkzeuge. Den Nutzen solch extrahierten Domänenwissens haben viele Fachleute in der aktuellen Entwicklungsphase der KI bestritten. Dabei liegt in solchen hybriden KI-Algorithmen die Zukunft, also in Algorithmen, die sowohl Vorwissen einprogrammiert bekommen als auch dazulernen.

Was sind hybride KI-Algorithmen?

Sie vereinen zwei Paradigmen – sie versuchen, Domänenwissen vom menschlichen Experten direkt in den lernenden Algorithmus einzubringen. Simple Einsichten können in der Theorie Lernalgorithmen effektiver machen, man nennt das „Inductive Biases“. Aber es wurde in den letzten Jahren immer wieder bestritten, dass Hybride mit menschlichem Vorwissen den reinen gelernten Agenten schlagen können.

KI-Forscher präsentieren immer wieder Erfolge in bekannten Spielen, im Schach, Go oder Poker. Stiftet das wirklich Nutzen für jedermann am Ende?

Die Frage wird viel zu selten gestellt. Der KI-Forscher Rodney Brooks hat einmal den schönen Satz festgehalten: Elephants don’t play chess. Und natürlich auch keine Atari Games. Die eigentlichen Schwierigkeiten stecken eben gerade nicht darin, in einer gut formalisierten Welt zu überleben. Sondern darin, in einer nicht formalisierbaren Welt autonom intelligente Entscheidungen zu treffen. Wir haben hier zwar Fortschritte gemacht – etwa in der Bilderkennung oder dem Verständnis natürlicher Sprache, wo für unmöglich gehaltene Dinge plötzlich möglich wurden.