https://www.faz.net/-gwz-9njjm

Google’s „Deep Mind“ : Künstliche Intelligenz ist jetzt der bessere Teamplayer

Illustration des Spielemodus „Capture the flag“ mit verschiedenen gleichzeitigen Optionen der unterschiedlichen Spieler. Bild: Deep Mind

Neue Stufe in der Evolution künstlicher Intelligenzen: In einem Videospiel hat sich Google’s Lernmaschine Deep Mind die ersten Meriten als bester Teamplayer seit jeher erobert.

          1 Min.

          Der Realitätscheck für künstliche Intelligenz (KI) in der Spielewelt hat eine neue Stufe erreicht. Im Schach und dem noch deutlich komplexeren Go sind die KI-Algorithmen und Lernmaschinen als Einzelspieler den menschlichen Großmeistern längst überlegen. Jetzt sind sie, wie eine Veröffentlichung von Google-Programmierern im Wissenschaftsmagazin „Science“ nahelegt, auch als Teamplayer einsame Spitze. Eine neue Evolutionsstufe der Google-Plattform „Deep Mind“ hat sich in dem populären 3D-Videospiel „Quake III Arena“ nach ein paar hunderttausend Trainingseinheiten besser bewährt als jeder andere im Team.

          Joachim Müller-Jung
          Redakteur im Feuilleton, zuständig für das Ressort „Natur und Wissenschaft“.

          In dem gespielten Modus „Capture the Flag“ geht es darum, dass mehrere Spieler eines zufällig zusammengewürfelten Teams mit dem Ziel, in einem immer wieder willkürlich wechselnden Labyrinth die Flaggen des gegnerischen Teams zu erobern. Die einzelnen Akteure können dazu die Gegner mit simulierten Laserwaffen in Schach halten. Am Ende kommt es darauf an, möglichst clever die Spieler des eigenen Teams zu positionieren und strategisch klug auf Veränderungen in der Zusammensetzung der Mannschaft zu reagieren. Deep Mind wurde, wie schon bei den früheren Versionen im Einzelspielermodus für Schach- oder Go-Turniere mit einem Maschinenlern-Algorithmus ausgestattet, der das Reinforcement Learning („Verstärkendes Lernen“) verfolgt.

          Dabei handelt es sich um den in der Natur ähnlichen Lernmodus, bei dem der Agent während des Trainings den Nutzen der eigenen Aktion bewertet. Im Unterschied zu den früheren Versionen, bekamen die KI-Agenten allerdings kein Vorwissen programmiert, sie lernten unabhängig voneinander, indem sie die Veränderung der Pixel und der Umgebung auf dem Bildschirm bewerteten. Nach 200.000 Spielen erbeuteten die KI-Agenten im Schnitt mehr Fahnen als die erfolgreichsten Quake-Arena-Spieler, nach 450.000 siegten sie fast immer – gleichgültig, ob sie mit ihresgleichen oder mit menschlichen Spielern zusammen arbeiteten.

          Weitere Themen

          Topmeldungen

          Karl Lauterbach (SPD), designierter Bundesminister für Gesundheit

          Künftiger Gesundheitsminister : Lauterbachs Fehler

          Karl Lauterbach ist qualifiziert für das Amt des Gesundheitsministers, doch seine Kompetenz könnte ihm in der Pandemiezeit im Wege stehen – denn ein Minister muss delegieren, also loslassen können.