Schon lange versuchen wir, die Grenzen von Kunstwerken aufzubrechen. Vor ein paar Jahren war es spektakulär, als Meisterwerke per sogenanntem Outpainting erweitert wurden. Dabei nutzte man generative KI, um ein Bild nahtlos zu erweitern – plötzlich konnte man sehen, wie die Mona Lisa unterhalb des Rahmens aussieht oder in welchem Raum sie gemalt wurde.

Später folgte der nächste Schritt: Aus statischen Bildern wurden Videos. Leonardo da Vincis Mona Lisa konnte dir plötzlich zuzwinkern oder dir sogar winken. Nun hat Google DeepMind, die KI-Schmiede von Google, einen weiteren großen Sprung gemacht – und eröffnet eine völlig neue Art, Kunst zu erleben.

Tauch ein ins Gemälde und entdecke eine neue Welt

Mit Genie 3, dem neuen KI-Modell, kann Google ganze, konsistente Welten erschaffen, in denen du dich frei bewegen kannst. Per einfachem Prompt lässt sich eine Umgebung kreieren, durch die du wie in einem Videospiel navigierst. Sieh dir das Video an – du wirst sofort verstehen, was ich meine.

Es geht aber auch auf eine andere Weise – und genau das demonstriert uns Aleksander Holynski. Er ist Forscher im DeepMind-Team und hat Genie 3 nicht per Texteingabe gefüttert, sondern mit einem echten Kunstwerk: Edward Hoppers legendärem Bar-Gemälde „Nighthawks“.

Und was passiert nun? Du kannst dich direkt im Bild bewegen. Plötzlich siehst du, was sich links und rechts außerhalb des bekannten Bildausschnitts befindet. Aber das ist nicht alles: Du kannst sogar die Bar verlassen und die nächtlichen Straßen um dieses weltberühmte Lokal erkunden. Lust, einmal unter Vincent van Goghs Sternenhimmel spazieren zu gehen oder um die Mona Lisa herumzutanzen? Genau das wirst du tun können, sobald Google diese Technologie für alle zugänglich macht!

Die bahnbrechende Technologie dahinter

Momentan dürfen nur wenige ausgewählte Personen – neben dem Team von Google DeepMind – mit dieser Technik experimentieren. Doch wie du oben siehst, sind die Ergebnisse jetzt schon beeindruckend. Besonders spannend: Google ist in der Lage, per einfachem Prompt echte 3D-Welten zu erzeugen, die für mehrere Minuten stabil bleiben. Du könntest also Hoppers Bar verlassen, durch die nächtliche Stadt schlendern und Minuten später wieder am Tresen stehen.

Im Moment ist diese virtuelle Welt nur für einige Minuten konsistent. Die Videos entstehen in HD-Auflösung mit 720 Pixeln und laufen mit 24 Bildern pro Sekunde. Weiter kannst du per Texteingabe direkt ins Geschehen eingreifen. Bist du gerade in der Bar, genügt ein einziger Prompt – und schon marschiert eine Blaskapelle herein oder was immer dir einfällt.

Noch mag das nach Spielerei klingen, aber denk das mal weiter: Aus einem Foto von Arbeitern auf einem Stahlträger ließe sich blitzschnell ein Plattform-Spiel machen. Und warum nur an Kunst denken? Stell dir vor, du stehst plötzlich wieder vor der Bühne deiner Lieblingsband oder erweckst eine legendäre Hausparty von 1990 zum Leben. Denn klar, natürlich wird das auch mit privaten Fotos funktionieren.

Ja, KI kann unheimlich wirken. Aber diese Technologie wird uns völlig neue, immersive Erlebniswelten eröffnen – das ist erst der Anfang!