Passer au contenu

DeepSeek : l’IA chinoise qui effraie les géants américains

Tempête dans le petit monde de l’IA générative. Un chatbot chinois inconnu, DeepSeek, a déboulé en tête du classement de l’App Store avec une technologie open source dont le développement a coûté 6 millions de dollars… pour des résultats proches de ceux de ChatGPT.

C’est la panique dans le milieu de l’IA américaine, un « moment Spoutnik », s’est inquiété Marc Andreessen, investisseur et proche conseiller de Donald Trump, en référence au premier satellite lancé par l’Union soviétique en 1957 qui a pris de court les États-Unis. Un chatbot chinois, DeepSeek, caracole depuis quelques jours en tête du classement des applications gratuites les plus populaires un peu partout dans le monde.

David contre Goliath

Le modèle de langage (LLM) le plus avancé proposé par le bot, DeepSeek-R1, ferait mieux que le modèle o1, le plus avancé d’OpenAI, sur des problèmes de maths et de raisonnement, selon des benchmarks réalisés par DeepSeek. Par défaut, le chatbot fonctionne avec DeepSeek-V3, qui aurait coûté moins de 6 millions de dollars à développer. Une goutte d’eau dans les centaines de milliards nécessaires à la conception de LLM performants, n’ont de cesse de rappeler les géants américains du domaine — à travers du projet Stargate, par exemple.

Lire Stargate : des contours très flous pour le projet à 500 milliards de dollars d’OpenAI

DeepSeek a ce petit côté David battant Goliath qui pourrait ébranler les certitudes de l’industrie US (et européenne) : avec ses modèles open source calculés avec des puces moins performantes que celles des champions occidentaux, le bot chinois ferait donc mieux… et même moins cher. Selon Epoch AI, le modèle de DeepSeek serait si efficace que son entraînement ne nécessiterait qu’un dixième de la puissance de calcul du modèle Llama 3.1 de Meta.

Qui dit bot chinois implique aussi des restrictions sur certaines requêtes « sensibles ». Impossible par exemple de demander à DeepSeek des questions en lien avec le soulèvement de la place Tien-Anmen ou sur Xi Jinping.

Depuis 2021, il est très compliqué de se procurer le silicium américain le plus évolué en Chine, en raison des restrictions imposées par la Maison Blanche. Pour pouvoir continuer à travailler, les développeurs IA chinois partagent leurs travaux entre eux et tentent de nouvelles approches. « DeepSeek s’est concentré sur l’optimisation des ressources grâce à des solutions logicielles », explique à Wired Marina Zhang, professeure associée à l’Université de Technologie de Sydney.

La spécialiste des technologies chinoises poursuit : « DeepSeek a adopté des méthodes open source, en mutualisant l’expertise collective et en favorisant une innovation collaborative. Cette approche permet non seulement de surmonter les contraintes en ressources, mais aussi d’accélérer le développement de technologies de pointe, ce qui distingue DeepSeek de ses concurrents plus fermés ».

DeepSeek a été créé en 2023 par Liang Wenfeng à Hangzhou. Cet ingénieur électronique a assemblé une batterie de 10 000 puces H100 de Nvidia qui sont désormais interdites d’importation en Chine. À cette infrastructure se serait ajoutée des puces moins puissantes toujours disponibles à l’import, et des optimisations pour limiter les coûts et réduire la puissance de calcul nécessaire à l’entraînement des LLM.

Le succès de DeepSeek est un vrai électrochoc pour l’industrie occidentale de l’IA. L’exemple chinois va peut-être la pousser à travailler davantage en commun, et à aller chercher plus d’efficacité avec les infrastructures existantes.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.

Source : Wired


Mickaël Bazoge