Gemini: Ein Menü in 4 Gängen

Unsere Gemini Fraktion hat neue Bilder generieren lassen und ein Menü in vier Gängen angerichtet. Die Ergebnisse wollen wir hier einmal vorstellen. Natürlich bleiben wir auch mit ComfyUI am Ball. Wie es damit weitergeht, werdet ihr in einem der nächsten Posts erfahren, versprochen.

Gemini erhielt die oben stehenden Anweisungen, aber es kam nicht ganz das heraus, was wir uns erhofft hatten. Die Formulierung „du schaust“ führte dazu, dass er eine Person in die Mitte des Bildes gerendert hat (Bild 1).

Also haben wir umformuliert. „Ein alter Bauerngarten mit Kräutern und Früchten.“ Wieder hat Gemini uns überrascht: Diesmal fehlte die Person in der Mitte, dafür wuchsen zwischen Tomaten und Kräutern sogar Zitronen (Bild 2).

Ein unerwünschter Gärtner im der Mitte und dann massenhaft Zitronen

Um die Zitronen zu entfernen formulierten wir noch einmal um: „Ein Kräutergarten mit vielen Kräutern und Früchten“. So erhielten wir (Bild 3).

Das Bild war in Ordnung. Wir haben die Anweisung trotzdem wiederholt, um es noch etwas schöner hinzukriegen. Entstanden ist (Bild 4), dass zur Abwechslung kreisförmig ausfiel.

Ein Menü in 4 Gängen: Kein Gärtner und keine Zitronen, die Formulierung macht‘s.

Insgesamt ein gutes Resultat! Wir lernen noch…

Alles in allem sind wir große Fans von Gemini, vor allem in Verbindung mit dem restlichen Google Ökosystem, NotebookLM und Google Docs. Wir sehen sehr wohl sein ungeheueres Potenzial und das, was seine Entwickler schon geleistet haben.  Trotzdem: Zum Bearbeiten oder Erstellen von Bildern ist Gemini derzeit nur bedingt geeignet. Zur Bildgenerierung wird Imagen 2 benutzt. Das hat sich seit 2024 zwar erheblich verbessert, ist aber noch weit davon  entfernt, Photoshop Konkurrenz zu machen. In der normalen Gemini Benutzer-Oberfläche kann man nur Text2Image generieren lassen, und die Bilder werden in der Regel quadratisch mit der maximalen Größe von 2048 × 2048 Pixel. Manchmal unterstützt Gemini auch 4:3 oder 16:9, was zu Bildgrößen von 1024 × 768 oder 1920 × 1080 führt. Das ist aber nicht immer verfügbar.

Im Google AI Studio kann man bedingt rechteckige Bilder generieren. Man kann dort auch Spaß haben mit einer Bildergeschichte oder eine Geburtstagskarte gestalten. Zusätzlich ist es möglich, Bilder hochzuladen und verändern zu lassen. Wirklich hochwertige Ergebnisse liefert das aber noch nicht. Wahrscheinlich kommt man am besten klar, wenn man das ganze als Spiel betrachtet und auf schöne Zufallsergebnisse hofft. Die gibt es nämlich wirklich.

Wenn man sieht, mit welchen großen Schritten die Entwicklung vorangeht, ist es aber vielleicht nur eine Frage von Tagen oder Wochen, bis diese Kritik überholt ist. Wir sind jedenfalls gespannt, wie es weitergeht. 

Zum AI-Bildlabor:

Translate »
Nach oben scrollen