Anthropic lance Claude Sonnet 4.6 avec une fenêtre contextuelle d'un million de jetons

Anthropic a lancé Sonnet, un modèle d'IA de niveau intermédiaire mis à jour. Ce modèle met l'accent sur les compétences en programmation, le respect des consignes et l'utilisation d'un ordinateur.

Ce modèle est déjà disponible par défaut pour les utilisateurs des forfaits Free et Pro.

En version bêta, LLM a bénéficié d'une fenêtre de contexte d'un million de jetons, soit le double des limites précédentes. Anthropic a souligné que le modèle est capable d'« intégrer des bases de code entières, des contrats volumineux et des dizaines d'articles scientifiques dans une seule requête ».

Cette version s'accompagne de nouveaux records dans des benchmarks tels que OSWorld (travail informatique) et SWE-Bench (tâches de programmation).

image

image

Amélioration constante des performances des différentes versions de Sonnet dans OSWorld. Source : Anthropic.

Dans le benchmark ARC-AGI-2, qui évalue les capacités de pensée abstraite, Sonnet 4.6 a obtenu un score de 60,4 %. Grâce à cet indicateur, le réseau neuronal a surpassé la plupart de ses concurrents, ne devançant que Opus 4.6, Gemini 3 Deep Think et une version modifiée de GPT 5.2.

image

image

Performances de Sonnet 4.6 dans divers tests de performance comparées à d'autres solutions. Source : Anthropic.

Début février, la startup a mis à jour son modèle phare, Claude Opus, à la version 4.6. Le réseau neuronal planifie mieux les actions, gère les tâches de longue durée et fonctionne plus efficacement avec de grandes bases de code.

« La productivité qui nécessitait auparavant un modèle de niveau Opus — y compris les tâches de bureau concrètes et rentables — est désormais disponible dans Sonnet 4.6 », indique le blog de l'entreprise.

L'entreprise a par la suite annoncé avoir levé 30 milliards de dollars, pour une valorisation de 380 milliards de dollars. Ces fonds seront utilisés pour la recherche avancée, le développement de produits et l'expansion des infrastructures.

Anthropic a annoncé une évaluation de sécurité à grande échelle de Sonnet 4.6 — le nouveau LLM « surpasse significativement » son prédécesseur en termes de résistance aux injections rapides .

Pour rappel, en février, les médias ont appris l'utilisation de l'outil d'IA Claude lors d'une opération militaire visant à capturer le président vénézuélien Nicolas Maduro.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *