OpenAI présente le générateur d'images « intelligent » ChatGPT Images 2.0

OpenAI a publié ChatGPT Images 2.0, un générateur d'images « intelligent » — « un modèle avancé capable de résoudre des tâches visuelles complexes et de produire un travail précis et prêt à l'emploi ».

Présentation de ChatGPT Images 2.0

Un modèle d'imagerie avancé qui prend en charge des tâches visuelles complexes et crée des visuels précis et prêts à l'emploi grâce à une édition plus précise, des mises en page plus riches et une intelligence « réfléchissante ».

Vidéo créée avec des images ChatGPT pic.twitter.com/3aWfXakrcR

– OpenAI (@OpenAI) 21 avril 2026

L'entreprise a constaté un « bond qualitatif » dans le respect des instructions, le placement précis et le respect des proportions des objets, ainsi que dans la visualisation de textes denses.

Ce modèle fonctionne avec aisance dans plusieurs langues et complète automatiquement les informations manquantes dans la requête, en s'appuyant sur le contexte visuel et général. Ainsi, l'utilisateur obtient le résultat souhaité avec moins de précisions.

Précision et contrôle

ChatGPT Images 2.0 prend des concepts complexes et les incarne visuellement avec précision.

Le modèle suit les instructions, préserve les détails spécifiés et reproduit les petits éléments à des résolutions allant jusqu'à 2K.

Plus grande précision et contrôle

ChatGPT Images 2.0 permet de conceptualiser des images plus complexes et de donner vie à cette vision de manière efficace.

Il peut suivre les instructions, préserver les détails demandés et restituer les petits éléments qui « cassent » souvent les images… pic.twitter.com/n29165pV9Q

– OpenAI (@OpenAI) 21 avril 2026

Travailler avec les styles

ChatGPT Images 2.0 capture avec une plus grande précision les caractéristiques des photographies, des images cinématographiques, du pixel art, des mangas et autres styles visuels. LLM assure une grande homogénéité des textures, de l'éclairage, de la composition et des détails.

Cette précision sera très utile lors de la création de prototypes de jeux, du développement de storyboards , de la préparation de supports marketing et de la création d'œuvres dans un format ou un genre médiatique spécifique.

Capable de penser

ChatGPT Images 2.0 est le premier modèle d'image d'OpenAI capable de réfléchir avant même d'être généré.

Associé à ChatGPT, le modèle peut rechercher des informations sur Internet en temps réel, créer plusieurs options pour une seule requête, vérifier les résultats et générer des codes QR fonctionnels.

« Cela permet au modèle de prendre en charge une grande partie du travail complexe entre l'idée et l'image, notamment lorsque la précision, la pertinence, la cohérence et l'intégrité visuelle sont primordiales », explique OpenAI.

Ce modèle prend en charge les formats d'image allant de 3:1 en largeur à 1:3 en hauteur. Il est disponible pour les utilisateurs de ChatGPT et de Codex.

La fonctionnalité « Images avec réflexion » est disponible dans les forfaits ChatGPT Plus, Pro et Business.

Rappelons qu'en avril, OpenAI a donné accès au nouveau modèle d'IA GPT-5.4-Cyber à un nombre limité d'utilisateurs.

Précision et contrôle

Travailler avec les styles

Capable de penser

Laisser un commentaireAnnuler la réponse