Innovation de rupture: Les leçons stratégiques de l’IA chinoise Deepseek
04 Fév 2025
Article du 3 février paru sur le blog de Philippe Silberzhan : Lire l’article directement sur son blog
L’émergence brutale de la startup Deepseek pour concurrencer les acteurs tels qu’OpenAI ou Meta est un coup de tonnerre dans le monde de l’IA. Les disrupteurs sont disruptés à leur tour. C’est l’illustration parfaite de la nature très particulière de l’innovation de rupture, qui la rend si difficile à appréhender. Voici huit leçons qu’on peut en tirer.
Le lancement de Deepseek a provoqué une onde de choc dans le monde de l’IA. Surgi de nulle part, son modèle égale les meilleurs comme ChatGPT ou Claude. L’Amérique pensait dominer l’IA de façon définitive et tout est remis en question. Et ce ne sont pas seulement les acteurs de l’IA qui tremblent, mais aussi les fournisseurs de puces haut de gamme (les fameux GPU), les fournisseurs d’équipement de réseau et les gestionnaires de centres de données, et même les fournisseurs d’équipement électrique.
En effet à l’heure actuelle, l’entraînement des meilleurs modèles d’IA est extrêmement coûteux. OpenAI, Anthropic, etc. dépensent plus de 100 millions de dollars uniquement pour le calcul. Ils ont besoin de centres de données massifs avec des milliers de GPU à 40.000$ pièce. Ils ont également besoin d’énormément d’énergie pour alimenter des centres. Tout ce modèle est remis en question.
Deepseek, en effet, a tout repensé. L’IA traditionnelle consiste à coder les nombres avec 32 décimales. Deepseek a réussi à n’en utiliser que 8. Résultat? 75% de mémoire utilisée en moins; on gagne en vitesse et en énergie. Ils ont également développé un système « multi-token ». L’IA normale lit comme un enfant, un mot à la fois. Deepseek lit des phrases entières en une seule fois. Il est deux fois plus rapide et 90 % plus précis. Lorsque vous traitez des milliards de mots, l’impact est considérable en termes d’efficacité brute. En outre, au lieu d’être une IA généraliste, Deepseek utilise des experts spécialisés qui ne se réveillent qu’en cas de besoin. Du coup, alors que les modèles traditionnels nécessitent 1,8 trillion de paramètres actifs en permanence, Deepseek se contente de 671 milliards, dont seulement 37 milliards ont besoin d’être actifs en même temps.
Les résultats sont impressionnants : le coût de l’entraînement passe de 100 millions de dollars à 5 millions de dollars. Le nombre de GPUs nécessaires passe de 100.000 à 2.000 et elles sont plus plus simples (des GPU de console de jeu plutôt que du matériel haut de gamme de centre de données). Le coût de l’API (accès au système pour des applications tierces) qui détermine le prix payé par les clients, est 95% inférieur. En plus, tout est open source. N’importe qui peut vérifier son travail. Enfin, Deepseek a fait tout cela avec une équipe de moins de 200 personnes alors que les géants comme OpenAi ou Meta entretiennent des armées d’ingénieurs pour un coût faramineux.
Quelles leçons tirer?
Deepseek est une histoire classique d’innovation de rupture. On y retrouve huit ingrédients habituels.
1. La rupture ne consiste pas à faire mieux, mais à faire différemment. Deepseek a repensé tous les aspects du modèle de l’IA en n’hésitant pas à questionner des modèles qui semblaient axiomatiques (par exemple, la seule voie de progrès est l’augmentation de la puissance brute).
2. La rupture modifie la valeur des ressources. Jusqu’à Deepseek, la maîtrise des GPU haut de gamme était stratégique pour faire de l’IA. Les US, avec Nvidia, contrôlaient l’industrie et l’interdiction de leur vente aux Chinois permettait de maintenir ce contrôle. Si on peut désormais créer un équivalent de ChatGPT avec des GPU normales, la valeur de Nvidia s’effondre et le contrôle du marché avec. C’est un peu comme Kodak qui contrôlait le marché de la photo avec ses compétences en chimie et son réseau de distribution, et a vu les deux devenir inutiles dans un monde numérique.
3. La rupture abaisse les barrières à l’entrée et réouvre le jeu. Jusque-là, pour jouer dans le monde de l’IA, il fallait énormément de capital. Il en faut désormais beaucoup moins. C’est notamment une bonne nouvelle pour tous les perdants du premier tour, notamment les acteurs européens de plus petite taille qui ne disposaient pas, et n’auraient jamais pu disposer, des mêmes montants en capital. Ils peuvent désormais espérer revenir dans le jeu. La rupture est ainsi la meilleure arme contre les rentes de situation. Les douves qui semblent ainsi protéger les grandes entreprises (position sur le marché, barrières à l’entrée, régulation en leur faveur, etc.) ressemblent davantage à des ruisseaux aisément franchissables pour qui sait s’y prendre et comprend qu’il ne faut pas attaquer les leaders sur leur terrain.
4. La rupture peut survenir très vite. On voit à quel point l’évolution de l’IA est extrêmement rapide, avec une reconfiguration du champ seulement quelques mois après que les places aient semblé avoir été attribuées. Ce qui est intéressant ici est la vitesse à laquelle les disrupteurs initiaux (OpenAI, Meta, NVidia) se font eux-mêmes disrupter, en quelques mois seulement. Rappelons que SpaceX, qui a aussi adopté une stratégie de rupture low-cost dans le spatial, a mis une bonne dizaine d’années avant d’avoir un véritable effet sur l’industrie, que les acteurs historiques comme Ariane ou Boeing, dominaient depuis des dizaines d’années.
5. La rupture fait mentir les prévisions en remettant en question l’évolution linéaire du monde. Le modèle d’IA basé sur la montée en puissance impliquait une consommation importante d’énergie, ce qui n’a pas manqué de susciter des critiques sur la base de prédictions alarmistes. Celles-ci étaient fondées sur le modèle selon lequel demain serait une continuation d’aujourd’hui, un grand classique en matière de prévision aveugle aux ruptures. La rupture est venue briser ce côté inéluctable en cassant le modèle. Cela n’est pas sans rappeler les prévisions apocalyptiques faites sur la production de crottin et d’urine à New York à la fin du XIXe siècle devant le nombre considérable de chevaux utilisés pour les transports. On n’en voyait pas l’issue, sauf à interdire les chevaux. Une dizaine d’années plus tard seulement, la voiture avait remplacé le cheval et le problème avait disparu.
6. La rupture est clé pour la croissance du marché. L’abaissement des coûts initié par Deepseek entraînera probablement une augmentation de l’utilisation de l’IA. Il y a deux siècles, l’abaissement du coût de production du tissu permis par l’introduction du métier à tisser avait permis une forte croissance du marché. Plus de gens pouvaient s’en acheter. Il s’agit d’un phénomène classique de démocratisation permis par l’abaissement des coûts. La rupture de Deepseek ouvre à l’IA de masse. Cela signifie que les besoins en matériel (et les coûts) vont chuter en relatif (beaucoup moins de ressources nécessaires à puissance égale) mais probablement pas dans l’absolu (beaucoup plus de puissance utilisée car moins chère). NVidia n’est donc pas au bord de la faillite, même si sa marge baissera probablement.
7. La réponse à une rupture est difficile pour les acteurs existants. Il est difficile pour un acteur qui a misé sur un modèle lourd de revenir en arrière, car il est à son avantage sur celui-ci. Cela rappelle les difficultés des compagnies aériennes classiques à répondre à la rupture du low-cost: celui-ci n’avait aucun secret pour elles, mais leur modèle d’affaire, et notamment les actifs mobilisés, rendait inattractif sa mise en œuvre.
8. La rupture rend difficile la guerre économique et les sanctions. Deepseek est né de la réaction chinoise au blocage des ventes de GPU haut de gamme Nividia. Cela montre, une fois de plus, qu’à moyen terme, tout système est adaptatif. En bons entrepreneurs, et en excellents ingénieurs, les Chinois ont fait d’une contrainte une opportunité. D’une certaine façon, le blocus américain a suscité la création d’un formidable concurrent. Les politiques ont perdu, les entrepreneurs ont gagné.
The show must go on
Deepseek, naturellement, n’est pas sans point faible. D’origine chinoise, elle est notamment obligée de refléter les vues de son gouvernement dans les réponses que donne son système (cependant les IA américaines souffrent également de biais importants). Mais si elle montre une chose, c’est que la partie est loin d’être jouée. L’innovation de rupture est rétive aux prévisions, aux trajectoires linéaires, aux situations acquises et aux manipulations politiques. Préparez-vous à de nouvelles surprises…
🇬🇧 Une version en anglais de cet article est disponible ici