Anthropic a introduit Claude Opus 4.7

Anthropic a lancé le Claude Opus 4.7, le modèle le plus puissant de la gamme Opus à ce jour.

La nouvelle version est ouverte à tous les utilisateurs payants de Claude et aux utilisateursde l'API — 5 $ pour 1 million de jetons entrants, 25 $ pour 1 million de jetons sortants.

Améliorations clés

Opus 4.7 excelle dans les tâches complexes. Les utilisateurs lui font confiance pour des tâches qui nécessitaient auparavant une surveillance étroite, ont indiqué les développeurs.

En programmation d'agents, le modèle a surpassé son prédécesseur de 10 % et en traitement visuel des données de 13 %. Pour les autres indicateurs, l'augmentation est plus modeste.

Le modèle dispose de capacités visuelles considérablement étendues : il traite des images jusqu'à 2576 pixels sur le côté le plus long (environ 3,75 MP) — plus de trois fois plus que les versions précédentes de Claude.

image

image

Source : Anthropique.

Opus 4.7 suit les instructions avec plus de précision. Les invites écrites pour les anciens modèles peuvent produire des résultats inattendus : elles interprétaient les instructions de manière approximative, tandis que la nouvelle version les prend au pied de la lettre. Il est recommandé de reconfigurer vos requêtes.

De plus, la dernière version de Claude a appris à mémoriser les informations entre les séances : elle enregistre des notes dans des fichiers et peut les utiliser dans chaque nouvelle conversation.

Anthropic a ajouté un nouveau niveau d'effort dans Opus 4.7, xhigh (« très élevé »), entre high et max. Il permet d'ajuster avec précision l'équilibre entre la profondeur d'analyse et la vitesse de réponse.

Dans Claude Code, le niveau d'effort par défaut a été augmenté à xhigh pour tous les plans.

Autres innovations :

  • Budgets des tâches (API bêta publique) — gestion des dépenses de jetons ;
  • /ultrareview — session de revue de code dédiée dans Claude Code ;
  • Mode automatique pour les utilisateurs de Max — Claude prend des décisions de manière autonome.

Limitations des capacités cybernétiques

Opus 4.7 est moins performant que Mythos Preview en matière de cybersécurité. Anthropic a volontairement réduit ces fonctionnalités lors de la formation. Le modèle intègre une protection qui bloque les requêtes interdites et à haut risque.

« Ce que nous apprendrons du déploiement concret de ces mécanismes de protection nous aidera à progresser vers notre objectif ultime : la diffusion à grande échelle des modèles de classe Mythos », a indiqué l'équipe de la start-up.

Les professionnels de la sécurité qui souhaitent utiliser Opus 4.7 à des fins légitimes (recherche de vulnérabilités, tests d'intrusion) sont invités à rejoindre le nouveau programme de vérification cybernétique chez Anthropic.

Pour les utilisateurs, ces limitations sont devenues problématiques. Certains clients se plaignent que le modèle refuse d'écrire du code car il « détecte des logiciels malveillants dans chaque requête ».

La réponse d'OpenAI

OpenAI a déployé une « mise à jour majeure » de Codex, actuellement disponible uniquement sur macOS.

La nouvelle version peut interagir avec les applications installées sur l'ordinateur de l'utilisateur : elle peut visualiser l'écran, cliquer et saisir du texte avec son propre curseur. Sur Mac, plusieurs agents peuvent fonctionner simultanément sans interférer avec d'autres logiciels.

Navigateur intégré, plugins et cycle de vie de développement

Codex intègre un navigateur : les pages peuvent être commentées directement, fournissant ainsi des instructions précises à l’agent. Ceci est particulièrement utile pour le développement front-end et de jeux.

Les développeurs prévoient d'étendre le contrôle du navigateur au-delà de l'environnement local.

Codex prend désormais en charge gpt-image-1.5 pour la génération et l'itération d'images. Associé aux captures d'écran et au code, cela permet de créer des concepts visuels, des designs d'interface, des maquettes et des jeux au sein d'une interface unique.

OpenAI a publié plus de 90 plugins supplémentaires qui combinent des compétences, des intégrations d'applications et des serveurs MCP, notamment Atlassian Rovo pour JIRA, CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon de Databricks, Remotion, Render et Superpowers.

Codex a ajouté la prise en charge des commentaires GitHub, de plusieurs onglets de terminal et de la connexion à des machines de développement distantes via SSH (en version alpha).

Les utilisateurs peuvent ouvrir des fichiers directement dans la barre latérale avec un affichage amélioré des PDF, des feuilles de calcul, des diapositives et des documents, et utiliser le nouveau volet de résumé pour suivre les plans des agents, les sources et les artefacts.

Mémoire et planification

Codex a appris à planifier les tâches futures et à reprendre automatiquement les projets de longue durée, même si cela peut prendre des jours ou des semaines. Les équipes utilisent l'automatisation pour tout, des demandes de revue de code au suivi des tâches sur Slack, Gmail et Notion.

image

image

Source : OpenAI.

Les développeurs ont amélioré la mémoire de l'assistant. Codex a appris à se souvenir du contexte utile des dialogues précédents : préférences personnelles et corrections.

Le modèle suggère également de manière proactive des actions utiles, en reprenant là où l'utilisateur s'est arrêté. Par exemple, un agent peut trouver des commentaires ouverts dans Google Docs, extraire des informations contextuelles de Slack, Notion et du code source, puis fournir une liste d'actions priorisées.

Nouveau modèle GPT

Par ailleurs, OpenAI a introduit le modèle d'IA GPT-Rosalind pour accélérer le développement de médicaments.

Elle porte le nom de la biophysicienne anglaise Rosalind Franklin, dont les recherches ont contribué à révéler la structure de l'ADN et ont jeté les bases de la biologie moléculaire moderne.

Les chercheurs ont constaté qu'aux États-Unis, le développement d'un nouveau médicament prend en moyenne 10 à 15 ans. L'avenir d'un médicament se joue en grande partie dès les premières phases de la recherche. Les principales difficultés résident dans l'analyse d'un volume considérable de publications scientifiques et de bases de données très spécialisées.

La tâche de GPT-Rosalind est d'assister un biologiste : résumer des textes scientifiques, formuler des hypothèses, concevoir des expériences et traiter l'information. Ce modèle est particulièrement performant pour les tâches liées aux protéines, aux gènes et aux structures biologiques similaires.

Sur le benchmark BixBench (analyse bioinformatique du monde réel), GPT‑Rosalind a montré l'un des meilleurs résultats parmi les modèles avec des données publiées.

Sur LABBench2, la solution a surpassé GPT-5.4 dans six des onze tâches. L'écart le plus important a été constaté dans CloningQA, qui nécessite la conception d'ADN et d'enzymes pour les protocoles de clonage moléculaire.

Par ailleurs, OpenAI a publié sur GitHub un plugin gratuit pour les sciences de la vie destiné à Codex. Accessible à tous les utilisateurs, il permet de connecter l'IA à plus de 50 bases de données scientifiques publiques et à des outils spécialisés.

Pour rappel, le 16 avril, Google a lancé Gemini 3.1 Flash TTS, un modèle de synthèse vocale mis à jour basé sur la génération Gemini 3.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *