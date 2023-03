Sie erzeugen in wenigen Sekunden ein spektakuläres Foto oder eine raffinierte Zeichnung, ohne dass es eines menschlichen Genies bedürfte: Bildgeneratoren mit KI verlangen weder künstlerische noch kreative Fähigkeiten, außer, dass der Nutzer phantasievoll in seinen Kommandos an die Maschine ist. Man gibt einfach Anweisungen als Text ein: „Spiderman, Donald Duck, Joker, Popeye, Superman und Wonder Woman grüßen den Papst vor einer Kulisse katholischer Ordensschwestern. Im Hintergrund befindet sich eine Kirche.“ Einige Minuten später hat die Software vier mögliche Motive erzeugt und zeigt sie in einem Vorschaubild an. Man wählt eines aus, das nun hochauflösend dargestellt wird. Das Ergebnis ist oben links zu sehen. Wonder Woman, Donald Duck und die Nonnen fehlen, und mit Popeye konnte der Algorithmus wohl nichts anfangen.

Das Foto zeigt die Stärke und die Schwäche der Bildgeneratoren. Gleich den Chat-Systemen mit künstlicher Intelligenz, etwa ChatGPT oder das neue Microsoft Bing, basiert die Software auf fortwährendem Training mit Material aus dem Internet. In diesem Fall Millionen von Bildern. Die KI „lernt“ anhand der Bildbeschreibungen, was ein Drache oder ein Hund ist, wie Superman aussieht und eine Kirche. Das Lernen erfolgt mit neuronalen Netzen und wie bei ChatGPT und Microsoft Bing gilt auch hier: Auf die Ergebnisse ist kein Verlass, weil die KI-Maschinen nichts „wissen“, sondern mit statistischen Zusammenhängen arbeiten.

Was man als Befehl eingibt, wird bestenfalls auch so erzeugt

Die hier gezeigten Fotos sind mit der Software Midjourney des gleichnamigen amerikanischen Forschungsinstituts entstanden. Die App lässt sich in einer Beta-Software am Windows- oder Mac-Rechner verwenden, und ihre Inbetriebnahme ist nicht einfach. Man benötigt ein Konto des Online-Diensts Discord und installiert dort Midjourney als einen Bot. Wie bei seinen Geschwistern Dall-E oder Stable Diffusion programmiert man Midjourney an einer Eingabeaufforderung mit Textkommandos. Was man als Befehl eingibt, wird bestenfalls auch so erzeugt. Man kann lange, ausführliche Phrasen eingeben und vorgeben, was man im Bild nicht sehen möchte. Alles, was irgendwie obszön werden könnte, weist die Maschine sofort zurück.

Auch können Personen des öffentlichen Lebens nicht in die künstlich generierten Kunstwerke integriert werden. Wir probierten es trotzdem und gaben vor: „Robert Habeck und Volker Wissing machen als beste Freunde Urlaub am Meer.“ Die beiden bärtigen Männer auf einem Boot, über das Möwen fliegen, ist das Ergebnis. Wir nehmen an, dass die KI mit beiden Namen nichts anfangen konnte.

Auch der Befehl „Die beliebtesten deutschen Politiker stehen an einem Swimmingpool und lächeln in die Kamera“ wurde nicht richtig ausgeführt. Die Software zeichnete gut gekleidete Menschen, die angezogen in einem Pool stehen.

Neben der Beschreibung lässt sich ein Kunststil und eine Darstellungsweise vorgeben. Links etwa gaben wir ein „Pferde stärken sich an einer Tankstelle im Stile Edward Hoppers“. Wie gut hier nun der Maler Edward Hopper getroffen wurde, sei dahingestellt. Auch die darunter zu sehenden „Roboter-Hunde auf einer Wiese, wie Hieronymus Bosch sie gemalt hätte“ brachte die KI an Grenzen.

Midjourney erlaubt es, eigene Fotos künstlerisch zu verfremden. Man lädt dazu einige hoch, es wird aus dem Bilderdatensatz eine URL erzeugt, die man wiederum in Szenen einbetten kann. Weil das Erzeugen der Fotos und Grafiken viel Rechenleistung erfordert, muss man bisweilen minutenlang auf ein erstes Ergebnis warten. Die Software kann man zunächst kostenlos ausprobieren, für den längeren Gebrauch ist ein Abonnement unabdingbar. Midjourney lässt sich mit der App „AI Art“ (für 23 Euro im Monat) in begrenztem Funktionsumfang auch auf dem iPhone ausprobieren.