OpenAI présente le générateur d'images « intelligent » ChatGPT Images 2.0

OpenAI a publié ChatGPT Images 2.0, un générateur d'images « intelligent » — « un modèle avancé capable de résoudre des tâches visuelles complexes et de produire un travail précis et prêt à l'emploi ».

L'entreprise a constaté un « bond qualitatif » dans le respect des instructions, le placement précis et le respect des proportions des objets, ainsi que dans la visualisation de textes denses.

Ce modèle fonctionne avec aisance dans plusieurs langues et complète automatiquement les informations manquantes dans la requête, en s'appuyant sur le contexte visuel et général. Ainsi, l'utilisateur obtient le résultat souhaité avec moins de précisions.

Précision et contrôle

ChatGPT Images 2.0 prend des concepts complexes et les incarne visuellement avec précision.

Le modèle suit les instructions, préserve les détails spécifiés et reproduit les petits éléments à des résolutions allant jusqu'à 2K.

Travailler avec les styles

ChatGPT Images 2.0 capture avec une plus grande précision les caractéristiques des photographies, des images cinématographiques, du pixel art, des mangas et autres styles visuels. LLM assure une grande homogénéité des textures, de l'éclairage, de la composition et des détails.

Cette précision sera très utile lors de la création de prototypes de jeux, du développement de storyboards , de la préparation de supports marketing et de la création d'œuvres dans un format ou un genre médiatique spécifique.

Capable de penser

ChatGPT Images 2.0 est le premier modèle d'image d'OpenAI capable de réfléchir avant même d'être généré.

Associé à ChatGPT, le modèle peut rechercher des informations sur Internet en temps réel, créer plusieurs options pour une seule requête, vérifier les résultats et générer des codes QR fonctionnels.

« Cela permet au modèle de prendre en charge une grande partie du travail complexe entre l'idée et l'image, notamment lorsque la précision, la pertinence, la cohérence et l'intégrité visuelle sont primordiales », explique OpenAI.

Ce modèle prend en charge les formats d'image allant de 3:1 en largeur à 1:3 en hauteur. Il est disponible pour les utilisateurs de ChatGPT et de Codex.

La fonctionnalité « Images avec réflexion » est disponible dans les forfaits ChatGPT Plus, Pro et Business.

Rappelons qu'en avril, OpenAI a donné accès au nouveau modèle d'IA GPT-5.4-Cyber à un nombre limité d'utilisateurs.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *