Mit der Einführung von Nano Banana 2, offiziell als Gemini 3.1 Flash Image bezeichnet, hat Google ein neues Kapitel in der KI-gestützten Bildgenerierung aufgeschlagen. Das Modell verspricht die Verknüpfung von komplexem Weltwissen und hoher visueller Präzision mit der Verarbeitungsgeschwindigkeit der Flash-Serie. Damit macht das Unternehmen Funktionen, die bisher der Pro-Version vorbehalten waren, einem breiteren Publikum zugänglich und integriert diese unmittelbar in das globale Google-Ökosystem.
Technologische Evolution und verbesserte Bildqualität
Das neue Modell Nano Banana 2 basiert auf der Architektur von Gemini Flash und zielt darauf ab, die Lücke zwischen schneller Generierung und professioneller Ästhetik zu schließen. Ein zentraler Aspekt der Neuerung ist die Einbindung von Echtzeitinformationen aus der Google-Suche. Diese ermöglicht es der KI, spezifische Themen und aktuelle Ereignisse akkurater darzustellen. Zudem wurde die Textwiedergabe innerhalb von Bildern optimiert, was die Erstellung von Marketingmaterialien oder Infografiken erheblich erleichtert.
In technischer Hinsicht bietet das Modell eine gesteigerte visuelle Wiedergabetreue. Optimierungen bei der Lichtführung, reichere Texturen und schärfere Details sollen für fotorealistische Ergebnisse sorgen. Dabei unterstützt das System Auflösungen von 512 Pixeln bis hin zu 4K und ermöglicht die flexible Anpassung verschiedener Seitenverhältnisse für unterschiedliche Plattformen.
Kreative Kontrolle und Konsistenz bei komplexen Aufgaben
Ein wesentliches Merkmal von Nano Banana 2 ist die verbesserte Konsistenz bei der Darstellung von Motiven. Das System ist in der Lage, die Ähnlichkeit von bis zu fünf Charakteren und die Details von bis zu 14 Objekten innerhalb eines Arbeitsablaufs stabil zu halten. Dies ist insbesondere für Storyboards und narrative Projekte von Bedeutung, bei denen das Erscheinungsbild der Protagonisten über mehrere Bilder hinweg unverändert bleiben muss.
Darüber hinaus wurde die Befolgung komplexer Anweisungen präzisiert. Google betont, dass das Modell nun feine Nuancen in den Eingabeaufforderungen besser erfasst, um sicherzustellen, dass die generierten Ergebnisse exakt den ursprünglichen Visionen der Nutzer entsprechen.
Integration in das Produktportfolio und Kennzeichnungspflichten
Die Ausrollung von Nano Banana 2 erfolgt über verschiedene Kanäle hinweg. Das Modell ersetzt die bisherige Technologie in der Gemini-App und wird zudem in die Google-Suche, Google Ads sowie in die Entwicklerumgebungen AI Studio und Vertex AI integriert. Auch in der Anwendung Flow wird es als Standardmodell hinterlegt.
Parallel zur technologischen Weiterentwicklung setzt Google verstärkt auf Transparenz und Herkunftsnachweise. Durch die Kombination der SynthID-Technologie mit interoperablen C2PA-Inhalten (Content Credentials) sollen Nutzer besser nachvollziehen können, wie und ob Künstliche Intelligenz bei der Erstellung eines Mediums eingesetzt wurde. Laut Unternehmensangaben wurde die SynthID-Verifizierungsfunktion in der Gemini-App seit ihrem Start bereits über 20 Millionen Mal genutzt.



