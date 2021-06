Noch mehr Daten, noch mehr Rechenleistung, noch vielschichtigere neuronale Netze: In der Künstlichen Intelligenz (KI) sorgen gegenwärtig Algorithmen-Systeme bislang nie dagewesener Größe für Aufsehen – und Sorge. Sie können anspruchsvollere Fragen beantworten, Liedtexte schreiben oder sogar Programmcode fortsetzen in einer Art und Weise, die sogar viele Fachleute verblüfft; und dies eben gerade auch, weil ihr Wissen scheinbar nicht hoch spezialisiert ist, sondern verschiedenste Bereiche zugleich umfasst.

Alexander Armbruster Verantwortlicher Redakteur für Wirtschaft Online. Folgen Ich folge



Das bekannteste verbirgt sich hinter dem Kürzel GPT 3, ausgeschrieben steht das für „Generative Pretrained Transformer 3“. Forscher der wesentlich von Elon Musk und dem IT-Konzern Microsoft unterstützten amerikanischen KI-Unternehmung OpenAI haben das Modell konstruiert und mit einer unvorstellbaren Datenmenge trainiert. Über 175 Milliarden Parameter verfügt GPT 3, die Zahl sagt etwas darüber aus, wie mächtig das System ist.

Als OpenAI GPT 3 im vergangenen Jahr erstmals öffentlich machte, war dies das bis dato größte künstliche neuronale Netz, das jemals erschaffen wurde. Allzu lange hat es diesen Rekord nicht gehalten, mittlerweile gibt es noch deutlich größere Systeme. Google stellte zu Beginn dieses Jahres sein Sprachmodell „Switch Transformer“ mit 1,6 Billionen Parametern vor.

F.A.Z. Frühdenker – Der Newsletter für Deutschland Werktags um 6.30 Uhr ANMELDEN

Die gegenwärtigen neuen Rekordhalter sitzen indes nicht an der amerikanischen Westküste, sondern in China, dessen Führung in der KI eine Schlüsseltechnologie nicht nur für kommerziellen Erfolg, sondern auch für strategisch-politische Stärke sieht – und dafür Milliardenbeträge mobilisiert. Die Beijing Academy of Artificial Intelli­gence (BAAI) präsentierte jüngst ihr KI-System WuDao 2.0, das mit seinen eigenen Angaben zufolge 1,75 Billionen Parametern zehnmal so groß ist wie GPT 3. Den Anspruch hinter WuDao, was übersetzt „Aufklärung“ bedeutet, machte BAAI-Verwaltungsratschef Zhang Hongjiang durchaus deutlich, der mit den Worten zitiert wird: „Der Weg zu allgemeiner Künstlicher Intelligenz liegt in großen Modellen und großen Computern.“

Aufhorchen ließ Forscher in Europa und Amerika infolge der Präsentation von WuDao 2.0 zudem, dass es sich im Gegensatz etwa zu GPT 3 um ein sogenanntes multimodales System handelt – also eines, das nicht nur mit Text trainiert wurde, sondern auch mit umfangreichem Bildmaterial und das entsprechend vielseitige Aufgaben erfüllen können soll. Die amerikanischen Wettbewerber Open­AI (mit DALL-E und CLIP) und Google (mit LaMDA und MUM) wiederum haben auch auf diesem Feld selbst etwas anzubieten.

Spezielle Supercomputer

Forscher in Europa sind angesichts dieser Serie neuer Riesenmodelle alarmiert aus mehreren Gründen, obwohl es durchaus einige Initiativen in diesem Bereich auch hier gibt. Einerseits sind das Verständnis und der Umgang mit Sprache seit Jahrzehnten eine zentrale KI-Disziplin mit weitreichenden Wirkungen. Die Qualität von Suchmaschinen, sozialen Netzwerken, Chatbots, Übersetzungen oder Empfehlungs-Algorithmen im Allgemeinen hängt davon schon heute ab – und künftig noch viel mehr, ganz gleich ob es um geschriebenen oder gesprochenen Text geht.

Andererseits erfordern die erwähnten KI-Systeme nicht nur gewaltige gut kuratierte Sprachdatenmengen, sondern eben auch enorme Rechenressourcen. „Die Hardwareanforderungen sind dabei dergestalt, dass Standard-GPU-Rechenzentren nicht geeignet sind. Diese speziellen technischen Anforderungen müssen bei der Planung der Rechenzentren bereits berücksichtigt werden“, heißt es in einem Positionspapier, das der KI Bundesverband gemeinsam mit führenden Akademikern und Vertretern von Unternehmen unter dem Projekttitel LEAM unlängst veröffentlichte. LEAM steht für „Large European AI Models“. Sie warnen: „Wegen des erforderlichen Aufwands, vor allem an Rechenkapazität, können diese Modelle nur von finanz- und ressourcenstarken Unternehmungen umgesetzt werden. Dies wird mittelfristig dazu führen, dass zentrale KI-Funktionalitäten von einigen wenigen Marktteilnehmern bereitgestellt und diese von Anwendern über den Aufruf von Programmierschnittstellen in der Cloud genutzt werden.“

Mehr zum Thema 1/

Und sie stehen nicht allein. „Die Gefahr, dass KI-Entwicklungen und -Anwendungen von amerikanischen Modellen abhängig werden, ist akut gegeben, und die Auswirkungen auf die europäische Technologiesouveränität, aber auch auf die Wirtschaft, sind kaum zu unterschätzen“, sagt Holger Hoos, KI-Professor an der Universität Leiden und Mitgründer des europäischen Forschernetzwerks CLAIRE. Er plädiert analog zum gleichnamigen Physikforschungszentrum für ein „CERN für KI“, in dem Forscher auf die nötige Rechen- und Dateninfrastruktur zurückgreifen können sollen, um selbst solche Modelle in Europa zu entwickeln.

Wolfgang Wahlster, der ehemalige Leiter des Deutschen Forschungszen­trums für Künstliche Intelligenz (DFKI), schätzt die Gefahr etwas weniger dramatisch ein, ruft aber ebenfalls dazu auf, mehr zu tun. „Wichtig ist für Europa eine große multilinguale Sprachdatensammlung. Das Aufbereiten, Kuratieren und Validieren solcher Sprachdaten ist aber eine aufwendige Arbeit, die für alle europäischen Amtssprachen sicher einen dreistelligen Millionenbetrag erfordert.“

Yann LeCun wiederum, KI-Chefwissenschaftler von Facebook und Professor an der New York University, weist darauf hin, dass etwa Frankreich längst reagiert. Der Staat hat den speziell auf das maschinelle Lernen ausgelegten leistungsstarken „Jean Zay“-Supercomputer eingerichtet und gemeinsam mit dem KI-Unternehmen Hugging Face ein Projekt aufgelegt, um ein GPT 3 ähnliches Modell für das Französische zu entwickeln. Wie Wahlster rät indes auch LeCun, der international zu den Pionieren des Deep Learning zählt, zudem, die neuen Riesenmodelle auch nicht zu überschätzen. Er hält sie für beeindruckend, aber zugleich noch sehr weit entfernt von echter allgemeiner Intelligenz. „Das ist kein gutes Dialogsystem, kein gutes Frage-Antwort-System, kein gutes medizinisches Diagnosesystem“, sagt er über GPT 3. Fortsetzung folgt.