25. April 2026, 6:38 Uhr | Lesezeit: 2 Minuten
Wer KI-Bilder erstellt, kennt das Problem: Je genauer die Idee, desto schwieriger wird oft die Umsetzung. OpenAI möchte genau an dieser Stelle nachlegen.
Oft braucht es mehr als eine kurze Beschreibung, um ein Bild nach den eigenen Vorstellungen erstellen zu lassen. Motive sollen an der richtigen Stelle sitzen, Schrift muss lesbar sein und das Format soll zum Einsatzzweck passen. Dafür stellt OpenAI jetzt ChatGPT Images 2.0 bereit. Das neue Bildmodell ist für ChatGPT, Codex und über eine Schnittstelle nutzbar.
Präzisere Ergebnisse bei genauen Vorgaben
Nach Angaben der Entwickler soll Images 2.0 ausführliche Anweisungen besser verstehen als ältere Versionen. Das betrifft vor allem Prompts, in denen mehrere Wünsche gleichzeitig vorkommen. Die KI soll etwa Texte im Bild genauer wiedergeben und Elemente zuverlässiger dort platzieren, wo sie hingehören. Auch bei Diagrammen, Benutzeroberflächen und aufwendigeren Layouts verspricht OpenAI stimmigere Resultate.
Beim Format bietet Images 2.0 mehr Spielraum. Das Modell deckt Seitenverhältnisse zwischen 3:1 und 1:3 ab. Dadurch sind sehr breite Darstellungen ebenso möglich wie hochkantige Motive. OpenAI nennt als Beispiele Banner und mobile Formate. Für Nutzer bedeutet das: Ein Bild lässt sich stärker auf den späteren Einsatz zuschneiden, ohne nur auf ein Standardmaß festgelegt zu sein.
WhatsApp hat prominente Funktion verloren
Was kann das neue KI-Tool „Whisk“ von Google?
Bildinhalte auch in mehreren Sprachen
Ein weiterer Punkt ist die Sprachunterstützung. Images 2.0 kann Inhalte in mehreren Sprachen erzeugen. Das kann wichtig sein, wenn nicht nur ein Motiv, sondern auch Wörter oder kurze Texte direkt im Bild vorkommen sollen. OpenAI sieht darin einen Vorteil für internationale Einsatzzwecke.
In ChatGPT kann Images 2.0 außerdem mit sogenannten „Thinking“-Workflows arbeiten. Dabei wird eine Aufgabe schrittweise verarbeitet. Zusätzlich lassen sich mehrere Ergebnisse ausgeben. Pro Anfrage sind bis zu acht Bildvarianten möglich. So kann man verschiedene Entwürfe vergleichen, bevor man sich für eine Version entscheidet.
Auch interessant: Bildgenerierung mit ChatGPT erlaubt Fälschen von Quittungen und Belegen
Verfügbarkeit und API für eigene Anwendungen
Das Modell ist ab sofort für alle Nutzer von ChatGPT und Codex verfügbar. Einige erweiterte Möglichkeiten hängen aber von kostenpflichtigen Abos ab. Wer Images 2.0 nicht nur direkt in ChatGPT nutzen möchte, kann es auch über die API „gpt-image-2“ in eigene Anwendungen einbinden.