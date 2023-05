Wer Bilder zur schlichten Veranschaulichung eines Textes benötigt, greift gern auf sogenannte Stock-Fotos zurück. In entsprechenden Bilddatenbanken finden sich Tausende Bilder, die zwar zur Ausschmückung von Inhalten, etwa auf Webseiten genutzt, aber keiner konkreten Situation zugeordnet werden können. Allerdings zeichnen sich die guten Stock-Bilder dadurch aus, dass sie vielen gefallen und dementsprechend häufig anzutreffen sind – vor allem, wenn sie aus kostenfreien Sammlungen stammen.

Einen Ausweg sollen mit künstlicher Intelligenz generierte Bilder bieten: Mit wenigen Stichworten rendert eine KI-Engine im Hintergrund einer Webseite Bilder, die so vorher noch nicht dagewesen sind. Mit der Qualität ist das allerdings so eine Sache. Zwar werden landauf, landab die neuen Möglichkeiten entweder in höchsten Tönen oder in düstersten Zukunftsszenarien dargestellt, die Ergebnisse sind jedoch aktuell noch durchwachsen, wie ein kleiner Überblick zeigt.

Prompts sind entscheidend

Während bei Anwendungen zur Erzeugung von Musik oder Videos mithilfe von künstlicher Intelligenz auf eine Vorauswahl mithilfe von Templates zur inhaltlichen Eingrenzung gesetzt wird, setzen die Bildgeneratoren auf die sogenannten Prompts. Dabei handelt es sich um eine Stichwort-Sammlung, die allerdings den richtigen Ausdruck benötigt, um zu den gewünschten Ergebnissen zu führen. Die Ergebnisse sind umso besser, je besser dieser Prompt ist. Mittlerweile wird der Prompt Writer zu einem eigenständigen Berufsbild. Für eine Vergleichbarkeit wurden verschiedenen KIs für die folgenden Bilder mit dem Prompt „inside digital online-magazin for latest tech-news in the sphere of laptop notebook smartphone mobil“ gefüttert.

Craiyon: Ganz schön krumm

Allerdings zeigt schon der erste Generator, dass man die Fähigkeiten der Künstlichen Intelligenz nicht in jedem Fall zu hoch hängen sollte: Denn wirklich brillant sind die Ergebnisse von Craiyon nicht. Zwar werden anhand der Prompts inhaltlich passende Bilder kreiert, aber die Qualität kann nicht so richtig überzeugen. Von „realistisch“ ist das Ganze weit entfernt. Die Ergebnisse der KI wirken überzeichnet, die Proportionen stimmen nicht immer. Insgesamt wirken die Darstellungen fehlerhaft.

Craiyon-Bilder sind vergleichsweise fehlerhaft

Midjourney mit viel Fantasie

Die Nutzung von Midjourney ist zwar vergleichsweise komplex, zumindest auf den ersten Blick, weil du dich zunächst auf einem Server einwählen musst. Die mit der KI erzielten Ergebnisse zeigen aber auch, warum sie eine der im Augenblick profiliertesten KIs ist. Das zeigt sich nicht nur an der Qualität der mit ihr erzeugten Bilder, die hinsichtlich ihr Proportionen überzeugen. Sie sind auch am einfallsreichsten und bereichern durchaus die Kreatität des Grafikers, dem für dieses Spielen mit den Motiven nicht nur gute Kenntnisse im Grafikprogramm abverlangt werden.

Neuroflash: Stock-Bild-Generator

Die Künstliche Intelligenz, die bei Neuroflash genutzt wird, erzeugt stimmige Bilder, auf den ersten Blick auch hinsichtlich der Proportionen im Detail überzeugen. Die Motive wirken realistisch und können klassischen Stock-Bild-Lückenfüllern durchaus Konkurrenz machen. Aufgrund des sehr vagen Prompts wirken natürlich auch die Bildergebnisse vergleichsweise generisch. Bevor du dich durch die Bildersammlungen von Pixabay und Co. wühlst, kannst du hier aber ein Experiment wagen.

Die Herkunft lässt sich auch bei den mit Neuroflash erzeugten Bildern nicht leugnen, alles in allem sind die Ergebnisse aber nicht so schlecht

Stable Diffusion

Stable Diffusion gehört ebenfalls zu den gefeierten Bildgeneratoren, die auf der Basis von künstlicher Intelligenz aus Texteingaben entsprechende Bilder produzieren. Die optischen Ergebnisse sind ähnlich wie bei Craiyon. Wer absolut fotorealistische Darstellungen erhofft, wird enttäuscht. Viel mehr sind auch hier die perspektivischen Verzerrungen nicht zu übersehen. Dafür sind die Möglichkeiten bei der Entwicklung eigener Prompts wesentlich umfassender: So lassen sich für die Bildgenerierung auch negative Stichworte definieren.

Die Richtung ist erkennbar

Playground AI: KIs zur Auswahl

Die Möglichkeiten und Ergebnisse von Playground AI ragen nicht unbedingt aus denen der anderen Angebote heraus. Auch hier wird die Bildgenerierung über Prompts bewerkstelligt. Mit ausschließenden Prompts können die Resultate verbessert werden, denen dennoch ihre Herkunft deutlich anzumerken ist. Der große Vorteil des Playground-Angebots besteht darin, dass nicht nur die hauseigene Playground AI zur Verfügung steht, sondern auch die KIs von Dall-E und Stable Diffusion zur Bilderzeugung genutzt werden können.

Ganz so verschroben sieht die Redaktion von Inside Digital in echt nicht aus

Bilder via KI sind ein Versprechen für die Zukunft

Die Möglichkeiten der Künstliche Intelligenz bei der Bildgenerierung mithilfe eines Large Language Modells (LLM) sind durchaus beeindruckend. Auch wenn nicht jede KI zu überzeugen vermag, werden teilweise dennoch verblüffende Ergebnissen geliefert. Dies gilt insbesondere für Midjourney. Aus dem Prompt entstehen fast schon kleine Kunstwerke, die mit einem klassischen Grafikprogramm viel Arbeit bedeuten würden. Unterm Strich sind die mit künstlicher Intelligenz erzeugten Bilder eine Alternative auf der Suche nach Illustration für Content.