Das kam jetzt ziemlich überraschend: Gerade eben hat Googles KI-Schmiede DeepMind offiziell ihre neue Bild-KI präsentiert. Nach den Indizien der letzten Tage war es schon sehr wahrscheinlich, dass Google dahintersteckt. Aber dass das Tool so schnell offiziell gemacht und direkt für alle Gemini-Nutzer angekündigt wird, damit haben wohl die wenigsten gerechnet.
Deshalb ist Gemini mit „Nano Banana“ so gut
Bisher war das Bilder-Tool unter dem Codenamen „Nano Banana“ bekannt. Jetzt läuft es bei LMArena (der Plattform, auf der KI-Modelle gegeneinander antreten und bewertet werden) unter dem Namen gemini-2.5-flash-image-preview. Dort kannst du übrigens auch die Top Ten sehen – und da liegt Google klar auf Platz 1, noch vor den Flux-Modellen (aus Deutschland) und GPT-Image-1 von OpenAI.
Warum das Tool so stark ist, haben wir ja neulich schon besprochen – Google selbst erklärt es aber noch einmal genauer:
„Wir wissen, dass bei der Bearbeitung von Bildern von sich selbst oder von Personen, die man gut kennt, selbst subtile Fehler wichtig sind – eine Darstellung, die ‚fast, aber nicht ganz‘ stimmt, fühlt sich einfach falsch an. Deshalb sorgt unser neuestes Update dafür, dass Fotos von Freund*innen, Familie und sogar Haustieren immer genauso aussehen, wie sie wirklich sind – egal, ob du ihnen einen Bienenkorb-Haarschnitt aus den 60ern verpasst oder deinem Chihuahua ein Tutu anziehst.„
Kurz gesagt: Das neue Modell kann dich wirklich genau so darstellen, wie du aussiehst – und es kann noch mehr. Google nennt ein paar Beispiele, die du sofort ausprobieren kannst:
Kostüm oder Ort ändern
Lade einfach ein Bild hoch – egal ob von dir, einem Familienmitglied oder deinem Haustier. Schreib dann in den Prompt, welche Kleidung du ändern willst oder an welchem Ort du dich sehen möchtest. Die KI folgt deinen Anweisungen aufs Wort und erzeugt eine Version, die perfekt zur Vorlage passt.
Fotos zusammenfügen
Lade einfach mehrere Bilder hoch – zum Beispiel zwei Fotos von Personen, die du gern zusammen auf einem Bild sehen würdest. Pack noch ein drittes Foto dazu, etwa einen einsamen Strand, und im Handumdrehen stehen die beiden Personen genau dort. Google zeigt in seinem Beispiel eine Frau und ihren Hund: Beide Bilder hochgeladen, in den Prompt geschrieben, dass die beiden zusammen vor einem Basketballfeld abhängen sollen – und fertig ist das Ergebnis.
Mehrere Bearbeitungsschritte
Du kannst dir deine Veränderungen, die du vornehmen willst, jetzt in einzelne Schritte einteilen. So kannst du ein Foto eines leeren Raums im ersten Schritt nutzen, um beispielsweise die Wand in einer bestimmten Farbe streichen zu lassen. Dann kannst du in einem weiteren Schritt Möbel hineinstellen lassen. Zum Schluss haust du dann Deko-Gegenstände ins Bild. Bei jedem dieser Schritte bleibt der Rest des Bildes unverändert, sodass du am Schluss eben ein Werk erstellt hast, bei dem die Tapete und die Möbelauswahl immer noch exakt so aussieht wie vorher.
Damit scheint Google das größte Problem anderer Bild-KIs gelöst zu haben: Bilder bleiben konsistent. Egal, ob du den Hintergrund änderst, die Bildkomposition, den Look oder sogar die Haltung einer Person – die Optik bleibt originalgetreu. Das könnte einen echten Run auf Google Gemini auslösen, denn seien wir ehrlich: Viele durchschnittliche ChatGPT-Nutzer machen mit der KI kaum etwas anderes, als Bilder zu generieren. „Nano Banana“ könnte also wirklich ein Gamechanger werden.
Wer kann diese Bilder-KI nutzen?
Wenn du ein bisschen mit dem Tool spielst, wirst du vermutlich auf unendlich viele Ideen kommen, was sich damit alles anstellen lässt. Du kannst das Design deiner Wohnung oder deiner Kleidung verändern, deine Wohnzimmer-Einrichtung mit einem Prompt umstellen oder einer Person eine bestimmte Handtasche geben. Soll eine Frau ein Kleid tragen, das genau so gemustert ist wie der Schmetterling auf einem anderen Foto? Kein Problem!
Die Frage ist nur: Ab wann steht uns das wirklich zur Verfügung – und wem genau? Google schreibt: „Die aktualisierte Bildbearbeitungsfunktion ist ab heute in Gemini verfügbar.“
In den Gemini-Apps und in der Web-Version ist davon bisher nichts zu sehen. Im Google AI Studio taucht das Feature zwar schon auf, liefert aktuell aber noch Fehler.
Wir müssen uns also vermutlich noch ein wenig gedulden, während das Update für alle kostenpflichtigen und kostenlosen Gemini-Versionen verteilt wird. In der Zwischenzeit kannst du schon mal überlegen, welche Foto-Experimente du starten willst. Adobe kann sich derweil überlegen, was sie dann künftig machen wollen, wenn Leute viel weniger professionelle Foto-Software benötigen.
Und noch ein Hinweis: Alle in Gemini erstellten oder bearbeiteten Bilder bekommen ein sichtbares Wasserzeichen. Zusätzlich versieht Google jedes Bild mit einem unsichtbaren digitalen SynthID-Wasserzeichen, damit immer klar ist, dass es KI-generiert ist.