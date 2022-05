AI, auch künstliche Intelligenz genannt, werden bereits von vielen Anbietern zur Erstellung unterschiedlichster Grafiken eingesetzt. Dabei können sogar täuschend echte Darstellungen von Menschen entstehen, ohne, dass es sich dabei um ein Foto handelt. Mit Imagen folgt eine AI zur Bilderstellung, die direkt von Google entwickelt wird. Das ist bisher über Googles AI bekannt.

Imagen: Was steckt hinter Googles AI?

Imagen ist nicht die erste künstliche Intelligenz, die eingegebene Worte aufgreift, um daraus Bilder für den Benutzer zu generieren. Ähnliches kann man bereits bei Seiten wie artflow.ai austesten. Was Imagen jedoch von bisherigen Programmen unterscheidet, ist die Komplexität an Textzusammenhängen, die das Programm identifizieren kann. Noch ist Imagen nicht für die Öffentlichkeit zugänglich, die bisherigen Ergebnisse erscheinen jedoch vielversprechend.

In der Theorie ist der Prozess einfach. Man formuliert mit einem Satz welches Ergebnis man sich vorstellt und versucht es der AI so genau wie möglich zu beschreiben. Damit die generierte Grafik jedoch annähernd den Wünschen des Nutzers entspricht, muss diese einiges leisten können. Sie benötigt daher Mechanismen, die ihr ermöglichen, ein tiefes Verständnis von Sprache zu entwickeln. Wie bei vielen künstlichen Intelligenzen machen sich hier neuronale Netzwerke bemerkbar. Imagens Grafiken zeichnen sich dabei durch einen hohen fotorealistischen Detailgrad sowie ein tiefes Verständnis der eingegebenen Sprache aus.

Beispiele Imagens bisheriger Kreationen

Am besten lässt sich das anhand einiger Beispiele verdeutlichen. Dieses Bild erstellte Image mit der Aufforderung „a cute corgi lives in a house made out of sushi“. Das lässt sich mit „ein süßer Corgi lebt in einem Haus, das aus Sushi besteht“ übersetzen. Imagen muss hierbei mehrere unterschiedliche Anforderungen begreifen. Zum einen, dass man ein fotorealistisches Bild wünscht, zum anderen, dass dieses einen „süßen Corgi“ enthalten soll und dieser „in einem Haus aus Sushi“ lebt. Alle einzelnen Bestandteile des Satzes müssen daher von der künstlichen Intelligenz entsprechend verstanden werden, damit das erwünschte Bild entsteht. Man muss genau hinsehen, um zu bemerken, dass nicht alle Bestandteile des Bildes ein echtes Foto vermuten lassen.

Ein Corgi in einem Haus aus Sushi – ein künstlich mit Imagen erstelltes fotorealistisches Motiv

Dabei kann Imagen auch abstraktere EIngebungen auf Wunsch des Anwenders umsetzen. Diese Grafik entwickelte Imagen anhand der Worte „three spheres made of glass falling into ocean, water is splashing, sun is setting“ geschaffen. Übersetzt bedeutet das so viel wie „Drei Sphären aus Glas fallen in das Meer, Wasser spritzt, die Sonne geht unter.“ Obwohl man dem kuriosen Motiv natürlich ansehen kann, dass es sich dabei nicht um ein echtes Foto handelt, bietet es dennoch einen hohen Realismus-Faktor.

Kaum zu glauben – dieses Bild entstammt den Berechnungen einer AI

Zukünftige Anwendungsmöglichkeiten von Imagen

Bisher ist das Programm wohl eher als eine interessante Spielerei zu betrachten. Die Art, wie künstliche Intelligenz jedoch auf unsere Anforderungen reagieren und passende Inhalte entwickeln kann, verbessert sich stetig. Programme wie Imagen könnten daher künftig in vielen Bereichen zur Anwendung kommen, sofern Benutzer die notwendige Rechenleistung für dessen Komplexität bereitstellen können. Sei es bei Filmen, Videospielen, dem Erstellen von Logos für Firmen oder Hinweisgrafiken. Die AI wird hier zum verlängerten Arm des Menschen, um uns einen Teil der Arbeit abzunehmen. Dadurch ließen sich Grafiken und Inhalte, für die wir manuell sehr viel länger benötigen, deutlich schneller erstellen. Wie sich das auf die Entwicklungsprozesse von Filmen, Videospielen, Programmen oder anderen Grafikinhalten auswirkt, lässt sich noch nicht abschließend einschätzen. Man darf jedoch gespannt sein, wohin die Reise führen wird.