Dans un contexte géopolitique tendu, l'approvisionnement en puces pour l'IA devient un enjeu stratégique majeur. Les États-Unis, sous l'impulsion de Joe Biden, ont récemment durci leurs restrictions sur l'exportation de ces composants essentiels, visant à limiter l'accès de la Chine et d'autres pays à ces technologies avancées. Des restrictions qui ne sont pas sans conséquences…
Catégorie
🗞
NewsTranscription
00:00Qu'en est-il des restrictions américaines sur les puces pour l'intelligence artificielle ?
00:08On le sait, juste avant son départ, l'administration Biden, pour des raisons de sécurité nationale,
00:12a déposé un texte qui impose des restrictions sur l'exportation de technologies qui sont
00:17capables d'accélérer le traitement.
00:18Il y a alors où en est-on ? Et puis surtout, quel risque cela fait peser aujourd'hui sur
00:23le développement de l'Europe en matière d'intelligence artificielle ? Pour en parler,
00:27Yann Serra, bonjour.
00:28Bonjour Delphine.
00:30Vous couvrez pour ce magazine les domaines des serveurs, du réseau, de la virtualisation
00:35et on vous doit très récemment un excellent article sur la menace qui court sur la production
00:39de puces pour l'IA.
00:41A côté de vous, François Candelon, bonjour.
00:44Bonjour.
00:45Operating partner chez SevenTwo.
00:46SevenTwo, c'est ex-Apax partner, ce qu'on connaît bien ici aussi dans Smartech, fonds
00:50d'investissement européen basé à Paris.
00:53Vous êtes un expert en intelligence artificielle et stratégie numérique.
00:56Je voulais qu'on commence justement par un point sur notre niveau de dépendance en
01:01matière de puces pour l'IA.
01:03Quels sont les chiffres aujourd'hui de production ? Est-ce qu'on les connaît ces chiffres de
01:07production ?
01:08On les estime.
01:09En fait, les puces, les GPU qui servent à entraîner les LLM, les IA, sont vendues à
01:2198% par NVIDIA et on estime que NVIDIA met sur le marché 2 millions de ces GPU-là par
01:30an, donc 500 000 par trimestre.
01:33Aujourd'hui, ce qu'on entend quand on écoute l'écosystème, c'est qu'on n'en a pas assez.
01:37Non, on n'en a pas assez.
01:38Visiblement, c'est la chasse au trésor.
01:39Oui, parce qu'en fait, le problème qui se pose, c'est que l'année dernière, vous aviez
01:4575%, c'est-à-dire les trois quarts de la production, qui ont été avalés par les
01:50géants d'Internet, par six géants d'Internet.
01:53Les hyperscalers, c'est Microsoft Azure, Amazon AWS, Google GCP, ce sont ceux qui vont revendre
02:02après des services.
02:03Et puis, vous avez aussi les réseaux sociaux.
02:05On a XAI, on a Meta, Facebook, et puis on a ByteDance, qui est TikTok.
02:12Ces six acteurs-là ont avalé les trois quarts de la production.
02:17Du coup, il ne reste plus qu'un quart.
02:19Donc, ça va être un problème pour tous les petits hébergeurs et aussi pour tous
02:24ces projets et pratiques.
02:25J'ai envie de dire, si je m'appelle NVIDIA, pour moi, je ne vois pas de problème.
02:28Je me dis, c'est super, j'ai un potentiel de croissance extraordinaire.
02:31Sauf qu'il faut les produire.
02:33Non, mais voilà, c'est ça le problème.
02:34C'est qu'en fait, il faut les produire.
02:35Alors actuellement, il y a une seule usine à Taïwan qui va produire la nouvelle génération
02:39de puces.
02:40Et en fait, cette usine, elle a une production qui est finie.
02:44Depuis 2021, c'est toujours la même production.
02:47Et on estime que NVIDIA fait à peu près 3000 waffers.
02:52Les waffers sont les disques sur lesquels on grave les puces.
02:55Et fait à peu près 3000 waffers par mois.
02:58Et en fait, ce ne sera pas suffisant.
03:01En fait, il y a 65 puces par waffer.
03:03Après, il faut faire un peu des mathématiques.
03:05Mais en fait, on se rend compte que ce ne sera pas suffisant.
03:08Alors, on sait que ces 2 millions de puces qu'ils mettent sur le marché, ce sont des
03:12puces pour le monde occidental.
03:15C'est très difficile d'estimer ce qu'ils vendent à la Chine.
03:18C'est-à-dire qu'ils vendent des puces...
03:21Des générations précédentes.
03:23Non, ce n'est pas des générations précédentes.
03:25C'est moins performantes.
03:26Mais en fait, en vrai, on pense que ce sont les mêmes qui sont un petit peu bridées,
03:31si on peut dire.
03:32Et puis en fait, derrière, les Chinois peuvent très bien les débrider.
03:34On n'a pas l'info.
03:35On ne sait pas.
03:36Mais enfin, toujours est-il qu'il y a beaucoup trop de demandes par rapport à l'offre.
03:40François, est-ce qu'aujourd'hui, en Europe, on a cette inquiétude justement sur un manque
03:44d'approvisionnement en matière de puces ?
03:46Ce n'est pas encore arrivé jusque-là.
03:48Non, mais je pense qu'il y a plusieurs choses.
03:50Il y a déjà, non seulement le manque de puces, mais pour moi, le problème en Europe,
03:56c'est le manque d'appétit.
03:57C'est-à-dire que malgré tout ce que l'on voit et les 109 milliards qui ont été annoncés
04:03par le président Emmanuel Macron, les 200 milliards au niveau européen, etc.
04:09Je pense qu'aujourd'hui, moi, ce qui me frappe en Europe, c'est le manque de compréhension
04:16de cette révolution qui est en marche.
04:19Parce qu'aujourd'hui, si je prends même, je vais revenir sur la Chine, notamment avec
04:23DeepSeek, on sait bien que DeepSeek a utilisé quand même pour se faire tout un ensemble
04:28de GPU.
04:29Donc, le nombre n'est pas connu.
04:31Mais ce que l'on voit, c'est que nous allons arriver, et il y a encore des recherches pour
04:36des modèles de nouvelle génération qui, eux, vont demander des millions de GPU pour
04:40être entraînés.
04:41Et donc, face à ça, la question du contrôle de la distribution des GPU va être une arme
04:48géopolitique massive.
04:50Et donc, on se retrouve avec, est-ce que les Chinois vont en bénéficier ? Oui, non.
04:55Comment est-ce qu'ils vont trouver les moyens d'en chercher d'autres ? Ce que fait AMD ?
05:00Parce que Nvidia, pour l'instant, est en situation quasi-monopolistique.
05:03Mais les autres fournisseurs de puces essaient de se déployer sur des niches, un peu plus,
05:10ou de trouver des moyens d'intégrer, notamment par rapport au stockage.
05:15Il y a, si vous voulez, des difficultés, ce qu'on appelle en anglais des bottlenecks,
05:22qu'ils essaient de résoudre pour pouvoir être beaucoup plus efficaces.
05:25Donc, je pense que ce marché de la puce est un marché qui est en pleine évolution.
05:31Ça demande du temps, parce que n'oublions pas que nous sommes sur le physique.
05:34Quand on parle des data centers en Europe, et en France en particulier, on parle d'une
05:40mise en œuvre au mieux, une mise en 2027.
05:44Donc, il se passe du temps, on est dans un monde physique.
05:47On l'a un peu oublié.
05:49C'est pour ça, d'ailleurs, que la Silicon Valley, qui a été fondée là-dessus, réussit
05:53en fait à se développer encore mieux et être extrêmement active.
05:58Mais pour moi, le problème en Europe, c'est celui de l'appétit, de la compréhension.
06:02On n'est pas assez morts de faim, en fait, pour se bagarrer.
06:04On n'est pas d'un côté assez morts de faim, mais de l'autre côté, pour moi, il y a une
06:09phrase qui avait été dite par un professeur de stratégie à Harvard, Michael Porter,
06:14dans les années 90, qui disait que la compétitivité d'un pays dépendait de la capacité de son
06:18industrie à innover et à se moderniser.
06:22Je pense qu'aujourd'hui, avant même de penser GPU et autres, nous avons une vraie difficulté
06:28qui est la capacité et la volonté de nos industries, de nos PME, de nos ETI, de nos
06:35grands groupes, à effectivement embrasser cette nouvelle révolution.
06:40On en est où des restrictions américaines sur l'exportation des puces ?
06:44On en est toujours au même point que l'année dernière, où Joe Biden, à une semaine de
06:50partir, a décidé de poser des quotas et de dire qu'il n'y avait que 18 pays dans
06:56le monde, ça tombe bien, on en fait partie, qui ont le droit d'acheter autant de puces
07:00qu'ils veulent.
07:01La globalité des autres pays ne peuvent en importer que 50 000, ces fameux GPUs, tous
07:09les deux ans, ce qui n'est pas beaucoup.
07:13Et bien évidemment, la Russie, la Chine, tous ces pays-là n'ont pas du tout le droit.
07:18C'est zéro.
07:19Mais ils arrivent tout de même à en importer.
07:22Il y a quand même des conséquences pour la France.
07:25Le problème qu'on va avoir en France, c'est que si on peut en importer autant qu'on
07:30veut, on n'a pas le droit d'en réexporter.
07:34Donc typiquement, on va penser à des acteurs français du cloud, OVHcloud par exemple,
07:39qui veulent s'installer ailleurs, ne peuvent pas non plus emmener trop de GPUs.
07:43Mais même au-delà du cloud, on a aussi des industriels, l'armement, Thales, qui met
07:48des puces d'intelligence artificielle.
07:51Ils font des centres de contrôle super high-tech.
07:55Ça, typiquement, ça fonctionne avec ces puces-là.
07:57Ils ne pourront plus les vendre à l'Arabie Saoudite par exemple.
08:01Ou alors, il faut demander la permission à Donald Trump.
08:05Après, on ne sait pas si Donald Trump va l'accorder.
08:08C'est un petit peu le souci.
08:10Ce que j'aimerais dire, c'est que ça va un peu au-delà de l'Europe versus les Etats-Unis.
08:15Il faut comprendre qu'à l'heure actuelle, les gros acteurs de l'IA, de l'infrastructure
08:20d'IA, ce sont les gens du cloud.
08:22Ce sont véritablement les 6 acteurs dont on a parlé juste avant, mais qui sont même
08:26contre un petit peu le gouvernement américain.
08:28Aujourd'hui, Microsoft, par exemple, n'est pas du tout dans cette histoire de Stargate.
08:35Alors, s'ils y sont, ils ont donné leur nom.
08:37Mais en fait, quand on leur demande, parce qu'il y avait une histoire, un problème
08:40d'investissement sur Stargate.
08:41Vous savez, c'est 500 milliards.
08:42Personne n'a compris d'où allaient venir ces 500 milliards.
08:44On a dit, Microsoft, vous qui avez beaucoup d'argent, il y a votre nom, c'est vous
08:47qui allez tout apporter.
08:48Microsoft a dit, nous, on joue notre jeu à nous.
08:52Nous, on fait nos data centers et nous, on va continuer à acheter des GPUs pour les
08:56vendre partout dans le monde.
08:57C'est-à-dire qu'en fait, ce qui va se passer, c'est que demain, a priori, quand
09:00nous, les Français, on va vouloir faire de l'IA, on sera obligé d'acheter du service
09:06chez Microsoft pour pouvoir utiliser ces fameuses puces parce qu'elles ne seront pas disponibles
09:10sur le marché.
09:11Parce que les entreprises, même les grands industriels, ne pourront plus avoir leur propre
09:15data center.
09:16Même si on veut mettre 109 milliards sur la table, on n'est pas sûr de pouvoir les
09:21peupler, ces data centers.
09:22Donc, il faudra passer par les gens du cloud.
09:24Dans ces investissements, on retrouve les Américains.
09:27Oui, mais c'est pour ça que je pense que le terme « souveraineté » n'est pas le
09:31bon.
09:32Je pense qu'il faut parler d'autonomie stratégique.
09:34Oui, on n'a pas encore employé, vous noterez.
09:36Mais enfin, on y allait assez rapidement.
09:40Donc, je pense à l'autonomie stratégique parce qu'il faut que l'on réussisse à
09:44travailler avec ces hyperscalers pour pouvoir effectivement trouver une capacité de notre
09:50côté à pouvoir être autonome.
09:53Mais on ne sera pas dans une question, je pense que l'idée de se dire « tout est
09:57européen, on ne travaille qu'entre Européens, etc. » est une idée qui ne va pas fonctionner.
10:02D'abord, parce que le niveau de compétitivité ne sera pas là.
10:06C'est-à-dire que Mistral, c'est super.
10:09On sera toujours sous dépendance de toute façon.
10:12Je pense qu'il faut qu'on réfléchisse à la manière d'interagir et quels sont
10:16nos leviers pour interagir.
10:18Il faut qu'on danse avec ces loups technologiques.
10:22Alors, l'autre question, parce que je vous ai entendu parler d'Ipsy qui avait
10:26des puces moins performantes, moins rapides, moins puissantes.
10:29Mais finalement, on a besoin de quoi exactement aujourd'hui en matière de puces pour faire
10:32tourner ces grands modèles, pas que de langage ?
10:38Il y a deux étapes dans l'IA.
10:41Il y a l'entraînement qui a besoin de ces puces très performantes.
10:44Et puis après, il y a l'utilisation qu'on appelle l'inférence.
10:46C'est là où on a l'IA générative, où on a la reconnaissance de motifs sur les vidéos.
10:51Effectivement, dans le catalogue de NVIDIA, on a deux types de puces.
10:54On a ces fameuses puces pour l'entraînement qui ne sont livrées qu'à 2 millions d'exemplaires.
10:57Et on a d'autres qui sont plus proches des puces graphiques qu'ils faisaient auparavant,
11:01qui là, ont l'air d'être disponibles.
11:03Mais ça reste quand même du NVIDIA.
11:06L'idée, c'est qu'effectivement, peut-être que nous, demain, on n'aura pas besoin.
11:11C'est compliqué.
11:13Au départ, on s'était dit, finalement, l'entraînement, on va entraîner des langages.
11:17Une fois que tous les langages auront été entraînés, on n'aura plus besoin d'en entraîner.
11:21L'IA aura la connaissance universelle et on n'aura plus qu'à l'utiliser.
11:24Ça, c'était le point de départ.
11:26Et puis, grâce à des gens comme Mistral, grâce à des gens comme DeepSeek,
11:30on a compris que finalement, on était mal parti.
11:33Il vaut mieux avoir des petits modèles.
11:35Alors, on a dit, du coup, c'est frugale, ça a besoin de moins de puissance de calcul.
11:39Mais en fait, ce n'est pas vrai, parce que si vous avez 10 petits modèles
11:42qui sont 10 fois plus petits qu'un gros, ça revient exactement au même.
11:45On finit par avoir le même résultat.
11:48Donc, on s'est dit, finalement, on va devoir continuer à acheter ces puces très puissantes.
11:52Par ailleurs, on s'est rendu compte aussi que pour utiliser l'IA,
11:57c'est un peu technique, mais en l'occurrence, il faut une mémoire intégrée à la puce.
12:03Or, les mémoires intégrées à la puce, elles ne sont pas dans les puces qui sont censées faire de l'inférence,
12:08elles sont dans les fameuses puces, les grosses puces.
12:12Du coup, les gens du cloud ont très bien compris qu'il fallait faire des réserves de ces grosses puces-là,
12:18qu'ils n'allaient pas du tout les remplacer tous les ans pour sauver la planète,
12:22consommer moins d'énergie au fur et à mesure des nouvelles générations.
12:26Non, ils vont les garder pour continuer à faire des services d'utilisation.
12:30Donc, on est toujours sur ces fameuses grosses puces-là qui ont cette fameuse mémoire.
12:35Donc, ce qu'il faudrait faire, c'est qu'on arrive à créer des puces qui n'ont pas besoin d'autant de calcul,
12:43mais qui ont ces mémoires dedans.
12:45Pourquoi je vous dis ça ?
12:47Parce qu'on a en France un acteur qui s'appelle SeaPearl.
12:50Pour l'instant, il ne vende pas, il ne produit pas pour l'instant,
12:54mais c'est le seul qui va créer une puce qui, comme ça, ne va pas beaucoup calculer pour entraîner,
13:02mais va avoir cette mémoire qui va permettre à peu, normalement à pas cher,
13:07et en plus qui soit européenne.
13:09Et c'est un projet qui est financé par des projets européens.
13:12C'est France 2030, je crois, en partie.
13:15Donc, ça, c'est une option qui vous semble rassurante.
13:19Oui, qui est excitante.
13:21Bon, d'accord.
13:22Mais je pense, en revanche, il y a un point que je voudrais faire qui est édyptique.
13:27Ce n'est pas une rupture de génération.
13:29C'est-à-dire qu'en termes de performance, c'est un peu la même chose,
13:32mais c'est comme vous aviez les mêmes ingrédients et ça a été un super cuisinier qui a réussi à faire.
13:37Mais l'IA, en général, est toujours en mouvement.
13:41C'est-à-dire que la qualité des LLM, des LMM, donc Large Multi Model Models et autres,
13:48fait que nous allons aller vers une autre génération.
13:51C'est-à-dire que là, on n'est plus sur uniquement les modèles qui ne résonnent pas.
13:55On arrive aussi à des modèles qui résonnent.
13:57On va avoir des questions sur quel est le niveau d'intelligence dont on a besoin
14:01en fonction de la tâche que l'on donne.
14:05On n'a pas besoin de la même voiture pour amener ses enfants à l'école
14:08et puis pour faire la route, partir en vacances.
14:11C'est un petit peu ça qui va arriver.
14:13Et ça, on est dans une nouvelle étape de recherche
14:16qui va nécessiter énormément de ces puces très sophistiquées.
14:21Pour ajouter un point là-dessus, en fait, vers quoi on va ?
14:24On va vers ce qu'ils appellent l'IA agentique.
14:27L'IA agentique, qu'est-ce que ça va être ?
14:29Vous allez poser votre question à une IA.
14:31Et en fait, l'IA, plutôt que de vous répondre, plutôt que d'avoir un très gros modèle,
14:34elle va chercher elle-même toute seule sur Internet
14:37les autres agents qui sont spécialisés.
14:39Et elle va découper votre prompt en dix parties.
14:42Et chaque partie va être traitée par un agent, par une autre IA quelque part,
14:47hébergée chez quelqu'un d'autre.
14:49Donc, ça va beaucoup là-dedans.
14:52Effectivement, vous avez raison.
14:53Ça va aller au-delà d'avoir des puces.
14:55Il va falloir avoir des réseaux très rapides pour que ces IA communiquent.
14:59J'étais chez Cisco la semaine dernière.
15:01Ils travaillent beaucoup là-dessus.
15:02Et ils m'ont dit qu'il y a un truc extraordinaire.
15:04C'est que le Web3, le machin qui n'a jamais marché,
15:09en fait, grâce à cette IA agentique où les agents vont communiquer entre eux,
15:12ils vont devoir communiquer.
15:13Ils vont devoir s'identifier avec des blockchains.
15:15Et donc, ça va être la renaissance du Web3.
15:19Ils ont investi là-dedans pour rien.
15:21Totalement inorganique.
15:23Et principalement inorganique.
15:25C'est quelque chose.
15:27Ils vont créer leur Web3 à eux, les agents, entre guillemets.
15:30Oui, c'est ça.
15:31Bon, alors après, selon Cisco, il faut que ce soit ouvert.
15:34Là, on s'aperçoit, comme vous l'avez dit, François,
15:36qu'on a vraiment un problème très physique, très matériel aujourd'hui dans l'IA.
15:40Est-ce que vous êtes quand même optimiste avec les 109 milliards ?
15:44Et on doit rajouter quand même les 200 milliards d'euros au niveau de la Commission européenne.
15:48Est-ce que vous dites, là, on avance, parce que c'est justement pour des infrastructures physiques.
15:54Oui, absolument.
15:55Je dirais, est-ce que je suis optimiste ?
15:57C'est très bien qu'il y ait ces annonces.
15:59Maintenant, entre les annonces de la coupe aux lèvres,
16:02il se passe pas mal de choses.
16:04Donc, j'espère simplement que la coupe atteindra les lèvres.
16:07En fait, il faut un peu se méfier de ces annonces.
16:11On met de l'argent sur la table.
16:13Est-ce que c'est pour investir et puis après en tirer des dividendes de ce qui va créer 0 PIB ?
16:18Ou est-ce que c'est pour véritablement construire quelque chose ?
16:20Si on n'a pas les puces, on ne va pas construire grand-chose.
16:22Moi, j'aime bien l'approche européenne qui a été un peu différente de ce qu'on a fait, nous, en France
16:26et de ce qu'ont fait les Etats-Unis,
16:28qui est de dire, nous, en fait, on ne va pas investir que dans les GPU.
16:31On va aussi investir dans le stockage de données, dans les réseaux,
16:34parce que c'est ça, demain, le détail technique sur lequel l'IA va reposer.
16:41Parce que le stockage, c'est hyper important.
16:44Vous avez des puces qui traitent très vite vos informations.
16:48Mais les entreprises, elles veulent donner à manger,
16:51elles veulent injecter leurs propres données pour que l'IA leur réponde sur leurs besoins métiers.
16:55Mais si elles sont incapables d'injecter les données très rapidement,
16:58finalement, vous avez des puces très puissantes qui tournent à vide.
17:01Donc, en fait, on ne se rend pas compte,
17:03mais le stockage, c'est véritablement le nerf de la guerre après les GPU.
17:07Mais c'est pour ça, je pense qu'il y a la partie technique, la partie physique.
17:12Mais la partie, et moi, ce qui me frappe, c'est le retard que prennent nos entreprises dans l'adoption.
17:17Et ça, c'est un vrai souci.
17:19Et c'est pour ça que je trouve que...
17:21Elles font partie du maillon de la chaîne.
17:23Mais elles sont au cœur, parce que, d'une certaine manière,
17:26ce sont à elles de créer de la valeur, au-delà d'avoir des puces.
17:29Si les puces tournent à vide, si on ne sait pas les utiliser...
17:32Si on n'a pas de cas d'usage.
17:34Si on n'a pas de cas d'usage, ou si on ne crée pas de valeur avec.
17:37Je ne suis pas sûr que les cas d'usage soient la bonne option.
17:39Mais je pense qu'il faut redessiner davantage les processus.
17:42Il faut moderniser nos entreprises.
17:44Et c'est un gros travail de mise en œuvre de connaissances,
17:48de s'assurer que chacun réussit à, effectivement, redessiner ses processus.
17:53Le fait qu'on ait moins de frustrations et de frais de restructuration.
17:58Ça fait quand même beaucoup de conditions.
18:00Je vous invite à découvrir la dernière couverture de Diplomatie Magazine.
18:05Son grand dossier parle de géopolitique des migrations.
18:09Vous y trouverez aussi un dossier sur la cyber et lié au cœur des enjeux.
18:14Excellente magazine pour comprendre tous ces enjeux géopolitiques,
18:17notamment autour du numérique.
18:19Merci beaucoup à tous les deux.
18:21Yann Serra et François Candelon.