KOMMENTAR

Einkaufen, Sehen, Verstehen: Googles KI verändert alles

8 Min. Lesezeit in Pocket speichern
Im Rahmen der Google I/O hat uns Google seine Neuheiten präsentiert. Dazu gehört eine neue smarte Brille und ein ganzer Berg KI-Highlights. Sobald diese Tools verfügbar sind, sehen wir die Welt mit ganz anderen Augen – ich verrate dir, wieso.
Screenshot zeigt, was eine Frau ihre Google-Brille fragen kann.

Demo der XR-Glasses auf der Google I/O

Die Google I/O ist für uns Tech-Nerds jedes Jahr das Event, bei dem uns Google präsentiert, wohin die Reise in der nächsten Zeit geht. Hier haben wir erstmals die Google Glass in Action gesehen, lernten viele neue Android-Versionen kennen, und ließen uns durch viele KI-Tricks verblüffen.

Wenig überraschend stand die Keynote der Kalifornier am Dienstag nahezu komplett im Zeichen der künstlichen Intelligenz – und das auch absolut aus gutem Grund. Es ist also kein Zufall, dass Android nach der Android-Show letzte Woche diesmal nur eine Randnotiz war und die Begriffe Gemini und AI jeweils fast 100-mal fielen.

Ich möchte aber hier jetzt gar nicht alles Revue passieren lassen, was die Alphabet-Tochter Google uns aufgetischt hat. Wer das möchte, gibt sich vielleicht einfach das Video hier, das die komplette Keynote knackig kurz zusammenfasst:

Dieses Element von Youtube kann auf dieser reduzierten Version der Webseite nicht dargestellt werden.

jetzt ansehen

Es gab also viel über neue Gemini-Varianten, -Tarife und -Modi zu berichten. Es gab starke neue Video- und Bild-Plattformen mit Veo 3, Imagen 4, Flow und einiges mehr. Da wir hier aber langsam alle geschädigt sind, was Bilder von lustigen Action-Figuren und Selfies im Ghibli-Look angeht, ignoriere ich die Bild- und Video-Generierung einfach mal komplett.

Stattdessen möchte ich dir heute erzählen, welche große Klammer viele der Neuheiten meines Erachtens zusammenhält und was all das mit uns macht.

Google I/O: Die Welt mit anderen Augen sehen

Müsste ich die I/O-Keynote mit einem Satz zusammenfassen, würde ich wohl sagen, dass Google uns neue Wege aufgezeigt hat, wie wir dank KI mit der Welt da draußen interagieren. Damit du dir besser vorstellen kannst, worauf ich hinaus will, fange ich direkt mal an, und zwar mit dem Thema Shopping.

So kaufen wir künftig ein

Google wird uns bei der guten, alten Websuche künftig auch einen AI Mode anbieten. Schon heute bekommen wir KI-Splitter bei den Google-Ergebnissen angezeigt, aber das wird künftig deutlich ausgebaut. Auch beim Einkaufen wird dir dieser Modus – so Google – eine große Hilfe sein.

Willst du zum Beispiel eine Reisetasche kaufen, wird Gemini dazu beitragen, dass du nicht nur Anbieter solcher Taschen aufgelistet bekommst, sondern konkrete, an deinen Geschmack angepasste Vorschläge bekommst. Verfeinerst du deine Anfrage, indem du sagst „Ich will damit im Oktober nach Hamburg, da muss ich immer mit Regen rechnen“, schlägt man dir zum Beispiel nur wasserdichte Modelle vor.

Größer noch ist der Impact, wenn du Klamotten kaufen möchtest. Google lässt dich deine neue Wohlfühl-Hose erst virtuell anprobieren. Du lädst ein Foto von dir hoch und siehst dann direkt an dir dein neues Kleidungsstück – deutlich besser, als es im Netz nur an einem Modell zu sehen, dessen Körper so gar nichts mit deinem zu tun hat.

Da Google uns natürlich künftig auch mit KI-Agenten ausstattet, kann ein solcher Agent die gewünschten Produkte überwachen. Die Hose ist dir gerade zu teuer? Dann informiert dich Google automatisch, wenn der gewünschte Preis angeboten wird. Besser noch: Wenn du willst, wird über den „Buy for me“-Prozess der komplette Kauf abgewickelt. Die KI erkennt also die preisreduzierte Hose, packt sie dir in den Warenkorb und bezahlt per Google Pay. Schöne, neue Shopping-Welt.

Konzert-Freaks wie ich können so künftig auch bequem Tickets bestellen. Ein Kommando wie „Ich hätte gerne Karten für The Cure nächstes Jahr in London, am besten Front of Stage“ reicht aus, und Gemini rattert los. Durchsucht selbstständig die entsprechenden Webseiten, analysiert hunderte Ticket-Optionen, überprüft Preise und Verfügbarkeit und füllt sogar die lästigen Formulare aus. Alles, was du noch machen musst: Aus den Vorschlägen das gewünschte Ticket auswählen und dem Kauf zustimmen.

So sieht die Welt von morgen aus …

Mit dem „Project Aura“ sahen wir auch die neue Android-XR-Brille, die Google zusammen mit XREAL auf den Markt bringt. Hier handelte es sich bei der Präsentation zwar noch um einen Prototypen, beeindruckt hat mich das Teil dennoch.

Ähnlich wie bei den Meta-Rayban-Brillen sehen wir ein Device im klassischen Brillendesign, also kaum als smarte Brille zu erkennen. Was die Brille kann? Riskiere doch einfach mal einen Blick auf dieses Google-Video:

Dieses Element von Youtube kann auf dieser reduzierten Version der Webseite nicht dargestellt werden.

jetzt ansehen

Du kannst mit der Brille, die mit dem Smartphone verbunden ist, also Musik hören, durch eine fremde Stadt navigieren, oder ein Foto machen. Alles Dinge, die wir auch von anderen Brillen kennen. Hier hast du aber jetzt auch ständig Google Gemini mit an Bord – deine KI erhält also Augen! Starrst du also auf ein Gebäude, kannst du Gemini Fragen dazu stellen. „Ist das wirklich der Hauptbahnhof?“ – „Nein, das ist Gebäude XY, der Bahnhof liegt 100 Meter dahinter“, also so in der Art.

Bei der Präsentation klappte das schon sehr ordentlich. Aber mehr noch: Die Brille beziehungsweise die KI erinnert sich auch an die Dinge, die du gesehen hast. Bei der Demo trank die Trägerin der Brille hinter der Bühne einen Kaffee. Später auf der Bühne fragte sie, woher der Kaffee eigentlich gewesen ist, den sie eben getrunken hat. Gemini lieferte den Namen der Kette und konnte natürlich auch mit Informationen zur nächstgelegenen Filiale liefern, inklusive Wegbeschreibung.

Die wiederum sieht so aus, dass du auf dem Brillendisplay mittig jeweils den nächsten Step angezeigt bekommst. Schaust du hingegen nach unten, erblickst du am Boden eine Übersicht von Google Maps, die dir den Weg weist.

… und so hört sie sich an

Wirklich begeistert hat mich aber das Translate-Feature. Ihr wollt eine Person nach dem Weg fragen, seid aber der benötigten Sprache nicht mächtig? Kein Problem, weil Gemini dir den Spaß in Echtzeit übersetzt und als Untertitel anzeigt. Denk mal daran, was das nicht nur für Touristen in einem fremden Land bedeutet, sondern auch für Gehörlose, die die Worte ihres Gegenübers nicht mehr mühselig von den Lippen lesen müssen!

Dazu passt übrigens auch noch eine Google-Meet-Innovation. Künftig werden wir auch dort von KI-gestützter Übersetzung profitieren. Bei der I/O zeigte man uns, wie im Video Call Menschen in unterschiedlichen Sprachen kommunizieren. Man erhält eine gesprochene Übersetzung, nahezu in Echtzeit, die sogar Sprachmelodie und Stimmung einfängt.

Apropos Video Call: Wir konnten auch einen Blick auf Google Beam werfen. Zusammen mit HP hat man sich da was echt Feines ausgetüftelt: Wenn du in dein virtuelles Business-Meeting gehst, setzt du dich in eine spezielle Kabine – und dein Gegenüber sitzt dir in 3D gegenüber. Dafür braucht es kein VR-Headset oder ähnliche Späße, sondern lediglich Kameras, Mikros und natürlich einen Hauch KI-Magie.

Wie so ziemlich alles, was ich dir hier heute erzählt habe, ist auch Google Beam noch nicht für jedermann verfügbar, sondern wird noch getestet. Erste Business-Kunden sollen sich das Equipment aber noch dieses Jahr bei HP sichern können.

Mein Fazit: Google und KI – was rollt da auf uns zu?

Aus einem ganzen Füllhorn an Neuheiten, Funktionen und innovativen Ideen habe ich dir jetzt lediglich eine Handvoll herausgepickt. Ich glaube aber, dass diese Beispiele ausreichen, um ein Bild dessen zu zeichnen, was schon bald Realität für uns wird. Oder anders: Wir sehen, wie Internet, KI und unsere reale Offline-Welt noch einmal anders zusammenwachsen.

Wir überwinden Sprachbarrieren, kaufen entspannter ein, verstehen unsere Umgebung besser und genießen einfach ein deutlich entspannteres Leben. Bei der Nutzung der Brille musste bei den Demonstrationen beispielsweise nicht ein einziges Mal das Handy aus der Hose geholt werden.

Das wichtigste Wort dabei vielleicht: Kontext! Gemini weiß irgendwie immer, was du gerade willst. Egal, ob du die KI in der Brille fragst, ob sie sich daran erinnert, wo du den Autoschlüssel hingelegt hast, oder ob du bei der Google Suche nach einem Produkt fragst, das perfekt zu dir passt.

Etwas Wasser in den Wein

Mir ist bewusst, dass ich meine I/O-Eindrücke recht begeistert und positiv geschildert habe. Weil ich auch wirklich riesiger Fan dieser Technologien bin. Aber ich möchte dir natürlich auch nicht verschweigen, dass beim Thema KI stets Faszination und Grusel Seite an Seite stehen. Denn ja: So schön wie das alles aussieht und wie bequem das Leben dadurch auch wird – wir dürfen dabei auch die Schattenseiten nicht vergessen. Wie sicher sind all die Technologien? Und was ist mit all den Daten? Möchte ich, dass ausgerechnet die Datenkrake Google alles sehen kann, was ich sehe – und sich später auch an alles erinnert, was ich gesehen habe?

Wir werden an anderer Stelle sicher nochmal darüber reden, wie wichtig es ist, dass die hohen KI-Standards, die wir hier in Europa etablieren wollen, nicht unterschritten werden. Heute war mir aber danach, einfach mal auf die I/O zu blicken und mich an den Dingen zu erfreuen, die wir bald mit unseren Handys und smarten Brillen anstellen können.

Keine Kommentare

[-AMP Version-]