
La startup spécialisée en intelligence artificielle Anthropic a mis à jour son modèle phare, Claude Opus, à la version 4.6. Ce réseau neuronal planifie mieux les actions, gère les tâches de longue durée et fonctionne plus efficacement avec de grandes bases de code.
La fenêtre de contexte a été étendue à 1 million de jetons. Ce volume vous permet d'analyser des documents volumineux et de mener de longs dialogues sans perdre le fil logique.
Les algorithmes mis à jour sont optimisés pour les tâches professionnelles : réalisation d’analyses financières, de recherches, utilisation et création de documents, de feuilles de calcul et de présentations.
Opus 4.6 a obtenu le meilleur score au test de programmation Terminal-Bench 2.0 et a surpassé ses concurrents dans le test de référence complexe de pensée logique interdisciplinaire Humanity's Last Exam.

Opus 4.6 comparé à ses concurrents dans plusieurs tests. Source : Anthropic.
Dans GDPval-AA, qui mesure la qualité du raisonnement et de la prise de décision, le modèle a surpassé GPT-5.2 d'OpenAI. LLM a également obtenu les meilleurs résultats dans BrowseComp, qui mesure la capacité à trouver des informations difficiles à trouver sur Internet.

Source : Anthropique.
Opus 4.6 extrait efficacement les données de documents volumineux. Grâce à la fenêtre de contexte étendue, le modèle repère et capture des détails cachés et non évidents.
équipes d'agents
Une innovation majeure réside dans la possibilité de créer des groupes d'agents collaborant. Dans ce mode, plusieurs assistants IA travaillent en parallèle et coordonnent leurs actions de manière autonome.
Cet outil convient aux travaux qui sont décomposés en tâches indépendantes et qui nécessitent l'analyse de volumes importants de texte.
boucle fermée
Anthropic a déclaré qu'ils « créent Claude avec Claude ». Les développeurs écrivent du code en utilisant leur propre modèle d'IA, et chaque nouveau produit est testé sur les tâches internes de l'entreprise avant sa mise en vente.
L'équipe a constaté qu'Opus 4.6 accorde plus d'attention aux parties les plus difficiles d'une tâche sans instructions supplémentaires, accomplit rapidement les tâches simples, gère mieux les problèmes ambigus et reste efficace sur le long terme.
« Opus 4.6 analyse plus en profondeur et examine attentivement son raisonnement avant de prendre une décision. Cela donne de meilleurs résultats pour les cas complexes, mais peut augmenter les coûts et les dépenses pour les cas simples », a indiqué l'entreprise.
Sécurité
L'audit automatisé a révélé qu'Opus 4.6 avait une faible propension aux comportements indésirables : tromperie, flatterie, renforcement des fausses croyances des utilisateurs et facilitation des actes répréhensibles.

Ce modèle démontre un niveau de sécurité Opus 4.5. Source : Anthropic.
Pour valider le modèle, l'entreprise a mené la série d'évaluations la plus complète à ce jour, en appliquant pour la première fois de nouvelles méthodologies de test et en améliorant celles existantes.
Accessibilité et nouvelles fonctionnalités
Claude Opus 4.6 est désormais disponible via l'interface web, l'API et sur les principales plateformes cloud.
De nouvelles fonctionnalités ont été ajoutées à la boîte à outils du développeur :
- pensée adaptative — le réseau neuronal détermine de manière indépendante quand activer le mode de pensée profonde ;
- régulation de l'effort – quatre niveaux d'intensité de travail sont proposés : du plus faible au plus élevé ;
- Compactage du contexte — l’outil résume et remplace automatiquement l’ancien contexte lorsqu’une conversation approche un certain seuil de jetons.
Pour rappel, en janvier, le PDG d'Anthropic, Dario Amodei, avait prédit l'émergence imminente de l'IA générale et des pertes d'emplois.



