Il y a deux ans, demander à un générateur d’images la carte d’un restaurant français produisait des plats aux noms déformés : «bouf bourgignon», «croque mosieu». La typographie s’effondrait, les lettres se répétaient de façon capricieuse, tout texte dépassant quatre mots devenait illisible. ChatGPT Images 2.0, présenté la semaine dernièrepar OpenAI, produit désormais aussi bien de petites étiquettes que de longs blocs de prose avec une précision très élevée. Le modèle génère des captures d’écran que la société décrit comme visuellement indiscernables de celles issues d’un vrai ordinateur.
Des magazines, des mangas…
Ces dernières semaines, le système circulait sous le nom de code «duct tape» sur la plateforme LM Arena, sans identification. Des utilisateurs qui ignoraient son origine ont signalé ses performances sur la reproduction de couvertures de magazines et d’interfaces applicatives complètes.
OpenAI annonce qu’Images 2.0 conçoit des magazines entiers, des infographies, des cartes, des séquences de manga et des affiches publicitaires prêtes à imprimer, en résolution 2K. Le modèle génère jusqu’à huit images à partir d’une seule instruction, en maintenant la cohérence visuelle des personnages et des objets d’un cadre à l’autre. Storyboards et campagnes graphiques deviennent ainsi accessibles sans enchaîner manuellement les requêtes.
Le modèle se décline en deux versions. Instant produit des images rapidement pour un usage courant. Thinking, réservée aux abonnés payants, raisonne avant de générer et vérifie le résultat. Générer une bande dessinée ou une infographie complexe peut nécessiter plusieurs minutes, a indiqué OpenAI.
Le mode Thinking peut consulter le web avant de produire une image. Si un utilisateur demande une infographie chiffrée ou le logo exact d’une entreprise, le modèle cherche l’information en amont. Entraîné sur des données arrêtées à décembre 2025, il s’appuie sur cette capacité pour traiter tout fait postérieur.
ChatGPT Images 2.0 est disponible depuis ce mardi pour l’ensemble des utilisateurs de ChatGPT. Le mode Thinking reste limité aux comptes payants. Les développeurs accèdent au modèle via l’API, à un tarif variable selon la résolution et la qualité sélectionnées. OpenAI a indiqué qu’il sera également intégré à Codex, son application pour développeurs sur Mac.


