https://www.faz.net/-gqe-8uvh5

Künstliche Intelligenz : Wenn der Computer aggressiv wird

Demis Hassabis ist Mitgründer von Deepmind, Googles Abteilung für künstliche Intelligenz. Bild: dpa

Wann bekämpfen Computerprogramme sich und wann arbeiten sie zusammen? Forscher von Google haben das getestet - mit einem bemerkenswerten Ergebnis.

          Beinahe ein Jahr ist es nun her, dass ein schlaues Computerprogramm im traditionsreichen Brettspiel „Go“ den Weltmeister besiegte. Der spektakuläre Sieg ging durch die Presse. Fachleute staunten nicht nur über das Ergebnis. Denn das selbstlernende Programm, dass Mitarbeiter von Googles Abteilung für künstliche Intelligenz „Deep Mind“ erschaffen hatten, führte an einer Stelle einen strategischen Spielzug aus, der Profispieler vollkommen überraschte und von dem der Computer sogar „wusste“, dass er außergewöhnlich war.

          Alexander Armbruster

          Verantwortlicher Redakteur für Wirtschaft Online.

          Kürzlich besiegte dann eine von zwei Forschern der amerikanischen Carnegie-Mellon-Universität entwickelte künstliche Intelligenz vier der besten Pokerspieler der Welt. Auch das deuteten Experten als großen Schritt auf diesem Gebiet, denn einem Computerprogramm gelang es, unvollkommene oder irreführende Informationen wie einen Bluff korrekt zu interpretieren – der große Unterschied zu den Erfolgen in Go und zuvor schon im Schach, in Spielen, in denen es keine versteckten Informationen gibt.

          Computer verhalten sich je nach gemachter Erfahrung anders

          Nun ist wiederum Forschern von Google ein weiteres bemerkenswertes Experiment gelungen, das zeigt, wie und was Computer lernen. Sie haben künstliche Intelligenzen in einfachen zweidimensionalen Computerspielen gegeneinander antreten lassen. Dabei stellten sie fest, dass sie sich je nach Umfeld aufgrund gemachter eigener Erfahrungen unterschiedlich verhalten (zum Forschungspapier geht es hier entlang, auf Englisch). In einem ersten Spiel geht es darum, möglichst viele grüne Äpfel auf einer Fläche einzusammeln. Jeder Apfel bedeutet einen Spielpunkt. Die Spieler können aber auch einen Laserstrahl einsetzen und ihren Gegner dadurch vorübergehend außer Gefecht setzen. Dafür bekommen sie nichts, dieses Verhalten bedeutet zunächst einmal Kosten in dem Sinne, dass sie während dieser Zeit keine Äpfel sammeln können.

          Die Google-Fachleute um Joel Leibo haben 40 Millionen Spielschritte durchgeführt und dabei ermittelt: Wenn es ein großes Angebot an Äpfeln gibt, verhalten sich beide Spieler kooperativ, sie sammeln einfach ein und teilen sich quasi die Äpfel untereinander auf. Wenn sich das Umfeld so verändert, dass die Äpfel knapper werden, ändert sich das Verhalten hingegen: Die Spieler werden dann aggressiver, sie versuchen häufiger, den Gegner aus dem Spiel zu nehmen und in dieser Zeit die knapperen Äpfel einzusammeln – ohne, dass sie zuvor diese mögliche Strategie „erklärt“ bekommen hätten.

          „Weniger aggressive Strategien entstehen vor allem in einem Lernumfeld, das durch Überfluss geprägt ist, mit weniger Anwendungsmöglichkeiten für kostenträchtiges Verhalten“, schreiben die Forscher in ihrem Fachaufsatz. Sie fanden außerdem heraus, dass die künstliche Intelligenz in einem größeren und komplexeren zugrunde liegenden Netzwerk schneller lernte, den Wettstreiter zu sabotieren als in einem einfacheren System. Und dieses Verhalten sogar in einer Umgebung mit reichlichen Ressourcen (Äpfeln) an den Tag legte. Das Ergebnis mag menschlich intuitiv sein, es basiert auch auf Erkenntnissen aus der Spieltheorie. Dass Computer durch Lernen darauf kommen, dürfte in der Forschung gleichwohl Eindruck hinterlassen.

          Auch in einem zweiten Spiel erlernen die künstlichen Intelligenzen, miteinander zu kooperieren. Dieser Wettstreit besteht aus zwei Wölfen, die eine Beute jagen. Jeder einzelne kann sie erlegen, allerdings unter einem bestimmten drohenden Risiko (Schaden), nämlich sie an den Konkurrenten zu verlieren. Nach wieder Tausenden von Spielgängen zeigte sich, dass die beiden Jäger ihr Verhalten aufeinander abstimmen und lernen, die Beute gemeinsam zu erlegen und dann miteinander zu teilen.

          „Zum jetzigen Zeitpunkt betrachten wir die Kooperation zwischen Handelnden als wissenschaftliche Frage“, sagte Deep-Mind-Forscher Leibo gegenüber dem Internetdienst „Wired“. „Längerfristig könnte uns diese Forschung helfen, das Verhalten komplexer Systeme mit vielen Teilnehmern besser zu verstehen und zu kontrollieren wie beispielsweise eine Volkswirtschaft, Verkehr oder Herausforderungen für die Umwelt.“

          Weitere Themen

          Das neue Frankfurt

          Wirtschaftlicher Wandel : Das neue Frankfurt

          Bankenstadt, Drehkreuz, Logistik-Metropole: Wirtschaftlich wird die Stadt am Main von wenigen Branchen dominiert. Das wird sich ändern. Von einem „KI-Hub“ ist die Rede. Doch der Weg zum neuen Frankfurt ist weit und beschwerlich.

          Reißt Euch zusammen! Video-Seite öffnen

          Oxfam in Davos : Reißt Euch zusammen!

          Vor Beginn des Weltwirtschafsforums in Davos ruft Oxfam dazu auf, den Reichtum gerechter zu verteilen. Laut der Hilfsorganisation besitzen die 26 reichsten Menschen genau so viel, wie die ärmere Hälfte der Weltbevölkerung.

          Topmeldungen

          Auf der A81 am Hegaublick gilt bereits ein Tempolimit. Mehr als 130 km/h sind nicht erlaubt.

          Pro Tempolimit : Freie Fahrt für die Vernunft

          Die Sachlage ist klar: Wo Geschwindigkeiten begrenzt werden, sinkt die Zahl der Verkehrstoten deutlich. Man muss es leider so drastisch sagen: Für den Kick einer Minderheit in PS-starken Limousinen müssen jedes Jahr Menschen sterben. Ein Kommentar.
          Bundeskanzlerin Angela Merkel am Mittwoch auf dem Weltwirtschaftsforum in Davos

          In Davos : Merkel fordert Reformen für die globale Ordnung

          Die Bundeskanzlerin spricht sich auf dem Weltwirtschaftsforum für eine Stärkung des Multilateralismus aus. Und auch zu Deutschlands Fortschritten in der Digitalisierung findet Merkel klare Worte.
          Will die Brexit-Entscheidung hinauszögern: Yvette Cooper von der Labour-Partei

          Vor Brexit-Abstimmung : Ihr Antrag setzt May unter Druck

          Die Labour-Abgeordnete Yvette Cooper will einen ungeregelten Brexit doch noch verhindern. Sie bekommt für ihren Antrag parteiübergreifend Unterstützung – aber nicht von Premierministerin May.

          Debatte über Fahrverbote : „Die Grenzwerte sind sogar noch zu hoch“

          In einer Stellungnahme halten mehr als hundert Lungenärzte die Grenzwerte für Feinstaub und Stickoxid für zu niedrig. Sie argumentieren, dass dann ja alle Raucher tot umfallen müssten. Der Physiologe Holger Schulz hält dagegen: Das sei naiv.

          Newsletter

          Immer auf dem Laufenden Sie haben Post! Abonnieren Sie unsere FAZ.NET-Newsletter und wir liefern die wichtigsten Nachrichten direkt in Ihre Mailbox. Es ist ein Fehler aufgetreten. Bitte versuchen Sie es erneut.
          Vielen Dank für Ihr Interesse an den F.A.Z.-Newslettern. Sie erhalten in wenigen Minuten eine E-Mail, um Ihre Newsletterbestellung zu bestätigen.