Forschende KI : Galaktische Verwirrung
- -Aktualisiert am
Vorbild für Forschungsroboter: automatisierte Dribbelkünstler beim Robo-Cup Bild: dpa
Künstliche Intelligenz soll in Zukunft selbst Forschung betreiben. Doch in der Praxis stößt automatisierte Wissenschaft schnell an Grenzen.
Wenn es nach den Plänen von Hiroaki Kitano geht, dann wird 2050 ein besonderes Jahr. In diesem Jahr soll nicht nur zum ersten Mal eine Roboter-Fußballmannschaft gegen den amtierenden menschlichen Weltmeister antreten, bis 2050 sollen künstliche Systeme auch in der Lage sein, weitgehend autonom nobelpreiswürdige wissenschaftliche Entdeckungen zu machen. Kitano, Systembiologe und Informatiker am Systems Biology Institute in Tokio und CEO der Sony Computer Science Laboratories, hat beide „Challenges“ mit auf den Weg gebracht: den 1997 erstmals ausgetragenen Fußball-Wettbewerb Robo Cup und im letzten Jahr die Turing AI Scientist Grand Challenge.
Neu ist die Idee, Forschung zu automatisieren, nicht. In vielen Disziplinen, vor allem in Bereichen wie der Genetik, der Biotechnologie und der Materialwissenschaft, gibt es genug Arbeitsschritte, die zeitintensiv, teuer, fehleranfällig und auch nicht wirklich spannend sind. Etwa, wenn es darum geht, eine riesige Anzahl möglicher Kombinationen von Molekülen oder Mutationen zu testen, um ein möglichst gutes Material, eine interessante Substanz für ein Medikament oder ein Bakterium zu finden, das ein gewünschtes Produkt noch etwas effizienter herstellt.
Forschungsroboter sind da eine große Hilfe, spätestens seit Adam 2004 an der Aberystwyth University in Wales seine Arbeit aufnahm. Er war der erste, der nicht nur weitgehend selbstständig um die tausend Versuche pro Tag durchführen konnte, er prüfte auch ihre Ergebnisse und plante auf deren Basis weitere Experimente. Menschen mussten lediglich seine Vorräte auffüllen, Müll wegräumen und ihn mit Informationen über „sein Fachgebiet“, die Genetik der Bäckerhefe, versorgen. Adam fand im Genom der Hefe drei Kandidaten für die Herstellung eines Enzyms, das die Forscher schon lange interessiert hatte. Man feiert ihn als den ersten Roboter, dem selbstständig eine Entdeckung gelang. Doch Adams Möglichkeiten waren beschränkt. Seine Entdeckung war fachlich keine echte Sensation.
Wissenschaftliche Hilftstätigkeiten
Heute stehen riesige automatisierte Labors bereit, die man per Cloud Service nutzen kann und die Ergebnisse schneller liefern, als es Menschen je möglich wäre. Ein Bericht der US-amerikanischen National Academies of Sciences, Engineering, and Medicine kommt zu dem Ergebnis, dass der automatisierte Forschungsbetrieb, bestehend aus Digitalisierung, Laborautomatisierung und automatischer Datenanalyse, die Effizienz und das Tempo von Forschung erhöht, für mehr Transparenz, Nachvollziehbarkeit und Wiederholbarkeit sorgt. An der Carnegie-Mellon-Universität kann man Automated Science inzwischen studieren. Man müsse sich die Forschungsroboter so ähnlich vorstellen wie autonome Fahrzeuge, sagt der Leiter des Studiengangs, Robert F. Murphy.
Doch nach wie vor bewegen sich die Forschungsroboter in eher engen Welten mit klaren Vorgaben. Ob sie interessante Fragen und Erkenntnisse generieren können, ist bislang offen. Die Fundamentalkritik an automatisierter Wissenschaft hat der amerikanische Philosoph Thomas Tymoczko schon Ende der Siebzigerjahre in Bezug auf maschinelle Beweise mathematischer Theoreme formuliert: Was hilft ein Beweis, der so lang ist, dass Menschen ihn nicht nachvollziehen können? Kann etwas, bei dem der Mensch nicht entscheiden kann, ob es richtig ist, eine Erkenntnis sein? Unter anderem weil Menschen die Ergebnisse algorithmischer Berechnungen auch verstehen möchten, boomen die Bemühungen, undurchsichtige Verfahren aus dem Bereich des maschinellen Lernens durchsichtiger zu machen.
Die Probleme beginnen schon bei der Automatisierung von Hilfstätigkeiten, die menschliche Forscher schneller und produktiver machen soll. Etwa mit Programmen, die Literatur zu einem Thema zusammenstellen und auswerten oder darauf hinweisen, was man noch zitieren müsste.
Antrainierter Unsinn
Galactica aus dem Hause Meta wurde als System angekündigt, das in der Lage sei, „automatisch Wissenschaft zu organisieren“, wissenschaftliche Texte zusammenzufassen, zu kombinieren und beim Schreiben von Aufsätzen zu helfen. Nach nur drei Tagen wurde es wegen massiver Kritik wieder offline genommen. Der Hauptvorwurf gegen das mit 48 Millionen wissenschaftlichen Artikeln, Websites, Lehrbüchern, Skripten und anderen wissenschaftlichen Texten trainierte Programm: Es kann nicht zwischen Wahrheit und Fiktion unterscheiden. In den sozialen Medien präsentieren zahlreiche Experimentierfreudige derzeit ihre Ergebnisse, etwa einen Text über Bären im Weltraum, einschließlich diverser Details über Rasse, Gewicht, Alter und Geschlecht der Tiere, die mit einer Sputnik 2 ins All geflogen seien.
Diese Geschichten sind beeindruckend und problematisch zugleich. Beeindruckend, weil sie sich in der Tat immer besser und überzeugender lesen, problematisch, weil es eben dadurch immer schwieriger wird zu unterscheiden, was stimmt und was nicht. Fachleute warnen, solche Systeme könnten riesige Mengen Unsinn in der Welt verbreiten, und es dürfte kaum möglich sein, diesen wieder einzufangen.
Zumal dieser Unsinn auch in den Pool der Texte eingeht, mit dem kommende Algorithmen trainiert werden. Dies gilt nicht nur für Texte. Auch die vielen lustigen KI-generierten Bilder, die derzeit das Netz fluten, scheinen dazu zu führen, dass die Leistungsfähigkeit von Bilderkennungssystemen abnimmt. Fragen nach Autorschaft und Urheberrecht automatisch generierter Inhalte kommen hinzu.
Sprachmodelle wie Galactica, GPT-3 und ihre Verwandten sollen nach dem Willen ihrer Entwickler einmal die heutigen Suchmaschinen ablösen, sollen den Umgang mit unseren gigantischen Datenbeständen intuitiv und einfach machen: Computer, sag mir den Stand der Forschung! Offenbar benötigen sie dazu aber erst einmal einen besseren Unsinn-Filter. Dies dürfte nicht der kleinste der Schritte sein, die künstliche Systeme, die einmal selbstständig forschen sollen, bis 2050 zu bewältigen haben.