o1, la nouvelle IA d'OpenAI, se donne du temps pour résoudre les problèmes complexes

OpenAI ne relâche pas la pression. La société californienne avait lancé GPT-4o au printemps dernier, un grand modèle de langage (LLM) puissant, capable de prendre en compte aussi bien le texte que les photos ou la voix. Il permet à ChatGPT de répondre de manière convaincante, que ce soit à l’écrit ou avec une voix confondante de réalisme (ce qui ne l’empêche pas de raconter n’importe quoi à l’occasion).

Lire On a testé ChatGPT 4o, et on ne peut plus s’en passer

L’entreprise développe en parallèle des modèles à la finalité différente ; là où GPT-4o priorise la vitesse de réponse, le nouveau LLM baptisé o1 prend plus de temps pour répondre aux requêtes. Les modèles o1 reposent sur un entraînement qui les poussent à affiner leur processus de réflexion, en testant différentes stratégies et à reconnaître leurs erreurs. Cela leur permet de « raisonner » pour résoudre des tâches complexes et des problèmes plus difficiles dans les domaines de la science, de la programmation et des mathématiques.

À l’examen de l’IMO (les Olympiades internationales de mathématiques), le modèle o1 a atteint un score de 83 % de bonnes réponses, contre 13 % pour GPT-4o. En revanche, à l’inverse de son grand frère, o1 ne sait pas naviguer sur internet à la recherche d’une information, et on ne peut pas importer de fichier ou d’image. En fait, dans la plupart des cas, GPT-4o sera mieux adapté, à moyen terme.

Pour les tâches complexes, o1 sera plus qualifié. Ces capacités de raisonnement avancé seront utiles par exemple « aux chercheurs en santé pour annoter des données séquençage cellulaire, par les physiciens pour générer des formules mathématiques complexes nécessaires à l’optique quantique, et par des développeurs dans tous les domaines pour créer et exécuter des workflows en plusieurs étapes ». En sachant que les réponses seront plus longues à venir.

Les développeurs seront encore mieux servis par o1-mini, un modèle plus rapide et moins coûteux (de 80 % par rapport à o1) qui se montre « particulièrement efficace » pour le codage.

Les abonnés payants ChatGPT Plus et Team peuvent accéder aux capacités de o1 (en mode aperçu) et 01-mini en les sélectionnant dans le menu déroulant. Il faut toutefois savoir que le nombre de messages est limité à 30 par semaine pour o1-preview, et 50 pour 01-mini. Ce dernier modèle sera proposé dans un second temps à tous les utilisateurs du bot.

OpenAI va continuer à améliorer ces modèles, en y ajoutant la possibilité de travailler sur des images.

Lire OpenAI a besoin de bien plus d’argent que prévu. Les banques à la rescousse ?

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.

Source : OpenAI

GPT-4o o1 OpenAI

Mickaël Bazoge

Votre opinion

berger dit :

13 septembre 2024 à 07:33

Nous ne sommes qu’ au début, qu’ aux balbutiements, d’une découverte fabuleuse appelée à bouleverser l’ humanité. En bien comme en mal: nous vaincrons sans doute le cancer et autres maladies graves grâce à l’ IA, nous nous ferons plumer et arnaquer comme jamais avec l’ IA, mais le plus terrible est l’ usage que les Etats en feront. Je vais relire ma collection des lives d’ Asimov, je pense que j’ en aurai besoin..

Répondre
Olivier Guntern dit :

18 septembre 2024 à 10:35

Ce n’est pas le modèle qui est meilleur, c’est des systèmes externes notamment de boucle de rétroaction qui test les réponses affinent les questions et les renvoies au modèle jusqu’à savoir un résultat cohérent.
C’est une technique qui peut être appliquée à n’importe quel modèle.
Un Llm ne pourra jamais être bon en math sur des sujets dont il n’a pas la réponse dans ces données d’apprentissage.
OpenAI continue sa fuite en avant en bidouillant.
OG
Ingénieur IA

Répondre

Les commentaires sont fermés.