Anthropic revendique le meilleur modèle de langage face à OpenAI et Google

Le nouveau modèle de langage (LLM) Claude 3.5 Sonnet dévoilé hier par Anthropic en remontre aux cadors du secteur. Les benchmarks fournis par l’entreprise — qu’il s’agit donc de prendre avec des pincettes — montrent que le LLM est plus performant que le tout récent GPT-4o d’OpenAI sur la quasi-totalité des tests ; il fait également mieux que Gemini 1.5 Pro de Google.

Et le trophée du meilleur modèle de langage revient à…

Claude 3.5 Sonnet établit « de nouveaux standards » pour le raisonnement au niveau des études supérieures, sur les connaissances de niveau universitaire et les compétences en codage. Le LLM s’améliore également « dans la compréhension des nuances, de l’humour et des instructions complexes (…) et la rédaction de contenus de haute qualité avec un ton naturel et accessible », ajoute Anthropic.

Par rapport au précédent meilleur LLM de l’entreprise, Claude 3 Opus, cette nouvelle mouture a résolu 64 % des problèmes, contre 38 % pour son prédécesseur. Il est aussi mieux armé pour la vision, pour interpréter des graphiques et des tableaux par exemple, ou encore pour retranscrire du texte présent sur des images dégradées. Le test vidéo ci-dessous donne une petite idée des capacités multimodales impressionnantes du LLM :

S'abonner à 01net

À l’instar de GPT-4o dont on peut tester les capacités dans ChatGPT gratuitement, Claude 3.5 Sonnet est intégré dans la version gratuite du bot Claude, à essayer à cette adresse. Pour aller plus loin, un abonnement Pro à 20 $ est proposé.

Autre nouveauté pour ce nouveau modèle : les Artifacts. Quand Claude génère des bouts de code ou des documents, une fenêtre séparée affiche le résultat.

La fonction est encore expérimentale, mais elle servira de base pour un « environnement de travail collaboratif » ; Anthropic imagine un espace commun où plusieurs personnes pourront travailler sur le design et coder des projets, un peu comme les outils de collaboration en temps réel de Google Docs.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.

Source : Anthropic