SMART TECH - Puces IA, la dépendance américaine

B SMART

le mois dernier

Dans un contexte géopolitique tendu, l'approvisionnement en puces pour l'IA devient un enjeu stratégique majeur. Les États-Unis, sous l'impulsion de Joe Biden, ont récemment durci leurs restrictions sur l'exportation de ces composants essentiels, visant à limiter l'accès de la Chine et d'autres pays à ces technologies avancées. Des restrictions qui ne sont pas sans conséquences…

Catégorie

🗞

News

Transcription

Afficher la transcription complète de la vidéo

00:00Qu'en est-il des restrictions américaines sur les puces pour l'intelligence artificielle ?

00:08On le sait, juste avant son départ, l'administration Biden, pour des raisons de sécurité nationale,

00:12a déposé un texte qui impose des restrictions sur l'exportation de technologies qui sont

00:17capables d'accélérer le traitement.

00:18Il y a alors où en est-on ? Et puis surtout, quel risque cela fait peser aujourd'hui sur

00:23le développement de l'Europe en matière d'intelligence artificielle ? Pour en parler,

00:27Yann Serra, bonjour.

00:28Bonjour Delphine.

00:30Vous couvrez pour ce magazine les domaines des serveurs, du réseau, de la virtualisation

00:35et on vous doit très récemment un excellent article sur la menace qui court sur la production

00:39de puces pour l'IA.

00:41A côté de vous, François Candelon, bonjour.

00:44Bonjour.

00:45Operating partner chez SevenTwo.

00:46SevenTwo, c'est ex-Apax partner, ce qu'on connaît bien ici aussi dans Smartech, fonds

00:50d'investissement européen basé à Paris.

00:53Vous êtes un expert en intelligence artificielle et stratégie numérique.

00:56Je voulais qu'on commence justement par un point sur notre niveau de dépendance en

01:01matière de puces pour l'IA.

01:03Quels sont les chiffres aujourd'hui de production ? Est-ce qu'on les connaît ces chiffres de

01:07production ?

01:08On les estime.

01:09En fait, les puces, les GPU qui servent à entraîner les LLM, les IA, sont vendues à

01:2198% par NVIDIA et on estime que NVIDIA met sur le marché 2 millions de ces GPU-là par

01:30an, donc 500 000 par trimestre.

01:33Aujourd'hui, ce qu'on entend quand on écoute l'écosystème, c'est qu'on n'en a pas assez.

01:37Non, on n'en a pas assez.

01:38Visiblement, c'est la chasse au trésor.

01:39Oui, parce qu'en fait, le problème qui se pose, c'est que l'année dernière, vous aviez

01:4575%, c'est-à-dire les trois quarts de la production, qui ont été avalés par les

01:50géants d'Internet, par six géants d'Internet.

01:53Les hyperscalers, c'est Microsoft Azure, Amazon AWS, Google GCP, ce sont ceux qui vont revendre

02:02après des services.

02:03Et puis, vous avez aussi les réseaux sociaux.

02:05On a XAI, on a Meta, Facebook, et puis on a ByteDance, qui est TikTok.

02:12Ces six acteurs-là ont avalé les trois quarts de la production.

02:17Du coup, il ne reste plus qu'un quart.

02:19Donc, ça va être un problème pour tous les petits hébergeurs et aussi pour tous

02:24ces projets et pratiques.

02:25J'ai envie de dire, si je m'appelle NVIDIA, pour moi, je ne vois pas de problème.

02:28Je me dis, c'est super, j'ai un potentiel de croissance extraordinaire.

02:31Sauf qu'il faut les produire.

02:33Non, mais voilà, c'est ça le problème.

02:34C'est qu'en fait, il faut les produire.

02:35Alors actuellement, il y a une seule usine à Taïwan qui va produire la nouvelle génération

02:39de puces.

02:40Et en fait, cette usine, elle a une production qui est finie.

02:44Depuis 2021, c'est toujours la même production.

02:47Et on estime que NVIDIA fait à peu près 3000 waffers.

02:52Les waffers sont les disques sur lesquels on grave les puces.

02:55Et fait à peu près 3000 waffers par mois.

02:58Et en fait, ce ne sera pas suffisant.

03:01En fait, il y a 65 puces par waffer.

03:03Après, il faut faire un peu des mathématiques.

03:05Mais en fait, on se rend compte que ce ne sera pas suffisant.

03:08Alors, on sait que ces 2 millions de puces qu'ils mettent sur le marché, ce sont des

03:12puces pour le monde occidental.

03:15C'est très difficile d'estimer ce qu'ils vendent à la Chine.

03:18C'est-à-dire qu'ils vendent des puces...

03:21Des générations précédentes.

03:23Non, ce n'est pas des générations précédentes.

03:25C'est moins performantes.

03:26Mais en fait, en vrai, on pense que ce sont les mêmes qui sont un petit peu bridées,

03:31si on peut dire.

03:32Et puis en fait, derrière, les Chinois peuvent très bien les débrider.

03:34On n'a pas l'info.

03:35On ne sait pas.

03:36Mais enfin, toujours est-il qu'il y a beaucoup trop de demandes par rapport à l'offre.

03:40François, est-ce qu'aujourd'hui, en Europe, on a cette inquiétude justement sur un manque

03:44d'approvisionnement en matière de puces ?

03:46Ce n'est pas encore arrivé jusque-là.

03:48Non, mais je pense qu'il y a plusieurs choses.

03:50Il y a déjà, non seulement le manque de puces, mais pour moi, le problème en Europe,

03:56c'est le manque d'appétit.

03:57C'est-à-dire que malgré tout ce que l'on voit et les 109 milliards qui ont été annoncés

04:03par le président Emmanuel Macron, les 200 milliards au niveau européen, etc.

04:09Je pense qu'aujourd'hui, moi, ce qui me frappe en Europe, c'est le manque de compréhension

04:16de cette révolution qui est en marche.

04:19Parce qu'aujourd'hui, si je prends même, je vais revenir sur la Chine, notamment avec

04:23DeepSeek, on sait bien que DeepSeek a utilisé quand même pour se faire tout un ensemble

04:28de GPU.

04:29Donc, le nombre n'est pas connu.

04:31Mais ce que l'on voit, c'est que nous allons arriver, et il y a encore des recherches pour

04:36des modèles de nouvelle génération qui, eux, vont demander des millions de GPU pour

04:40être entraînés.

04:41Et donc, face à ça, la question du contrôle de la distribution des GPU va être une arme

04:48géopolitique massive.

04:50Et donc, on se retrouve avec, est-ce que les Chinois vont en bénéficier ? Oui, non.

04:55Comment est-ce qu'ils vont trouver les moyens d'en chercher d'autres ? Ce que fait AMD ?

05:00Parce que Nvidia, pour l'instant, est en situation quasi-monopolistique.

05:03Mais les autres fournisseurs de puces essaient de se déployer sur des niches, un peu plus,

05:10ou de trouver des moyens d'intégrer, notamment par rapport au stockage.

05:15Il y a, si vous voulez, des difficultés, ce qu'on appelle en anglais des bottlenecks,

05:22qu'ils essaient de résoudre pour pouvoir être beaucoup plus efficaces.

05:25Donc, je pense que ce marché de la puce est un marché qui est en pleine évolution.

05:31Ça demande du temps, parce que n'oublions pas que nous sommes sur le physique.

05:34Quand on parle des data centers en Europe, et en France en particulier, on parle d'une

05:40mise en œuvre au mieux, une mise en 2027.

05:44Donc, il se passe du temps, on est dans un monde physique.

05:47On l'a un peu oublié.

05:49C'est pour ça, d'ailleurs, que la Silicon Valley, qui a été fondée là-dessus, réussit

05:53en fait à se développer encore mieux et être extrêmement active.

05:58Mais pour moi, le problème en Europe, c'est celui de l'appétit, de la compréhension.

06:02On n'est pas assez morts de faim, en fait, pour se bagarrer.

06:04On n'est pas d'un côté assez morts de faim, mais de l'autre côté, pour moi, il y a une

06:09phrase qui avait été dite par un professeur de stratégie à Harvard, Michael Porter,

06:14dans les années 90, qui disait que la compétitivité d'un pays dépendait de la capacité de son

06:18industrie à innover et à se moderniser.

06:22Je pense qu'aujourd'hui, avant même de penser GPU et autres, nous avons une vraie difficulté

06:28qui est la capacité et la volonté de nos industries, de nos PME, de nos ETI, de nos

06:35grands groupes, à effectivement embrasser cette nouvelle révolution.

06:40On en est où des restrictions américaines sur l'exportation des puces ?

06:44On en est toujours au même point que l'année dernière, où Joe Biden, à une semaine de

06:50partir, a décidé de poser des quotas et de dire qu'il n'y avait que 18 pays dans

06:56le monde, ça tombe bien, on en fait partie, qui ont le droit d'acheter autant de puces

07:00qu'ils veulent.

07:01La globalité des autres pays ne peuvent en importer que 50 000, ces fameux GPUs, tous

07:09les deux ans, ce qui n'est pas beaucoup.

07:13Et bien évidemment, la Russie, la Chine, tous ces pays-là n'ont pas du tout le droit.

07:18C'est zéro.

07:19Mais ils arrivent tout de même à en importer.

07:22Il y a quand même des conséquences pour la France.

07:25Le problème qu'on va avoir en France, c'est que si on peut en importer autant qu'on

07:30veut, on n'a pas le droit d'en réexporter.

07:34Donc typiquement, on va penser à des acteurs français du cloud, OVHcloud par exemple,

07:39qui veulent s'installer ailleurs, ne peuvent pas non plus emmener trop de GPUs.

07:43Mais même au-delà du cloud, on a aussi des industriels, l'armement, Thales, qui met

07:48des puces d'intelligence artificielle.

07:51Ils font des centres de contrôle super high-tech.

07:55Ça, typiquement, ça fonctionne avec ces puces-là.

07:57Ils ne pourront plus les vendre à l'Arabie Saoudite par exemple.

08:01Ou alors, il faut demander la permission à Donald Trump.

08:05Après, on ne sait pas si Donald Trump va l'accorder.

08:08C'est un petit peu le souci.

08:10Ce que j'aimerais dire, c'est que ça va un peu au-delà de l'Europe versus les Etats-Unis.

08:15Il faut comprendre qu'à l'heure actuelle, les gros acteurs de l'IA, de l'infrastructure

08:20d'IA, ce sont les gens du cloud.

08:22Ce sont véritablement les 6 acteurs dont on a parlé juste avant, mais qui sont même

08:26contre un petit peu le gouvernement américain.

08:28Aujourd'hui, Microsoft, par exemple, n'est pas du tout dans cette histoire de Stargate.

08:35Alors, s'ils y sont, ils ont donné leur nom.

08:37Mais en fait, quand on leur demande, parce qu'il y avait une histoire, un problème

08:40d'investissement sur Stargate.

08:41Vous savez, c'est 500 milliards.

08:42Personne n'a compris d'où allaient venir ces 500 milliards.

08:44On a dit, Microsoft, vous qui avez beaucoup d'argent, il y a votre nom, c'est vous

08:47qui allez tout apporter.

08:48Microsoft a dit, nous, on joue notre jeu à nous.

08:52Nous, on fait nos data centers et nous, on va continuer à acheter des GPUs pour les

08:56vendre partout dans le monde.

08:57C'est-à-dire qu'en fait, ce qui va se passer, c'est que demain, a priori, quand

09:00nous, les Français, on va vouloir faire de l'IA, on sera obligé d'acheter du service

09:06chez Microsoft pour pouvoir utiliser ces fameuses puces parce qu'elles ne seront pas disponibles

09:10sur le marché.

09:11Parce que les entreprises, même les grands industriels, ne pourront plus avoir leur propre

09:15data center.

09:16Même si on veut mettre 109 milliards sur la table, on n'est pas sûr de pouvoir les

09:21peupler, ces data centers.

09:22Donc, il faudra passer par les gens du cloud.

09:24Dans ces investissements, on retrouve les Américains.

09:27Oui, mais c'est pour ça que je pense que le terme « souveraineté » n'est pas le

09:31bon.

09:32Je pense qu'il faut parler d'autonomie stratégique.

09:34Oui, on n'a pas encore employé, vous noterez.

09:36Mais enfin, on y allait assez rapidement.

09:40Donc, je pense à l'autonomie stratégique parce qu'il faut que l'on réussisse à

09:44travailler avec ces hyperscalers pour pouvoir effectivement trouver une capacité de notre

09:50côté à pouvoir être autonome.

09:53Mais on ne sera pas dans une question, je pense que l'idée de se dire « tout est

09:57européen, on ne travaille qu'entre Européens, etc. » est une idée qui ne va pas fonctionner.

10:02D'abord, parce que le niveau de compétitivité ne sera pas là.

10:06C'est-à-dire que Mistral, c'est super.

10:09On sera toujours sous dépendance de toute façon.

10:12Je pense qu'il faut qu'on réfléchisse à la manière d'interagir et quels sont

10:16nos leviers pour interagir.

10:18Il faut qu'on danse avec ces loups technologiques.

10:22Alors, l'autre question, parce que je vous ai entendu parler d'Ipsy qui avait

10:26des puces moins performantes, moins rapides, moins puissantes.

10:29Mais finalement, on a besoin de quoi exactement aujourd'hui en matière de puces pour faire

10:32tourner ces grands modèles, pas que de langage ?

10:38Il y a deux étapes dans l'IA.

10:41Il y a l'entraînement qui a besoin de ces puces très performantes.

10:44Et puis après, il y a l'utilisation qu'on appelle l'inférence.

10:46C'est là où on a l'IA générative, où on a la reconnaissance de motifs sur les vidéos.

10:51Effectivement, dans le catalogue de NVIDIA, on a deux types de puces.

10:54On a ces fameuses puces pour l'entraînement qui ne sont livrées qu'à 2 millions d'exemplaires.

10:57Et on a d'autres qui sont plus proches des puces graphiques qu'ils faisaient auparavant,

11:01qui là, ont l'air d'être disponibles.

11:03Mais ça reste quand même du NVIDIA.

11:06L'idée, c'est qu'effectivement, peut-être que nous, demain, on n'aura pas besoin.

11:11C'est compliqué.

11:13Au départ, on s'était dit, finalement, l'entraînement, on va entraîner des langages.

11:17Une fois que tous les langages auront été entraînés, on n'aura plus besoin d'en entraîner.

11:21L'IA aura la connaissance universelle et on n'aura plus qu'à l'utiliser.

11:24Ça, c'était le point de départ.

11:26Et puis, grâce à des gens comme Mistral, grâce à des gens comme DeepSeek,

11:30on a compris que finalement, on était mal parti.

11:33Il vaut mieux avoir des petits modèles.

11:35Alors, on a dit, du coup, c'est frugale, ça a besoin de moins de puissance de calcul.

11:39Mais en fait, ce n'est pas vrai, parce que si vous avez 10 petits modèles

11:42qui sont 10 fois plus petits qu'un gros, ça revient exactement au même.

11:45On finit par avoir le même résultat.

11:48Donc, on s'est dit, finalement, on va devoir continuer à acheter ces puces très puissantes.

11:52Par ailleurs, on s'est rendu compte aussi que pour utiliser l'IA,

11:57c'est un peu technique, mais en l'occurrence, il faut une mémoire intégrée à la puce.

12:03Or, les mémoires intégrées à la puce, elles ne sont pas dans les puces qui sont censées faire de l'inférence,

12:08elles sont dans les fameuses puces, les grosses puces.

12:12Du coup, les gens du cloud ont très bien compris qu'il fallait faire des réserves de ces grosses puces-là,

12:18qu'ils n'allaient pas du tout les remplacer tous les ans pour sauver la planète,

12:22consommer moins d'énergie au fur et à mesure des nouvelles générations.

12:26Non, ils vont les garder pour continuer à faire des services d'utilisation.

12:30Donc, on est toujours sur ces fameuses grosses puces-là qui ont cette fameuse mémoire.

12:35Donc, ce qu'il faudrait faire, c'est qu'on arrive à créer des puces qui n'ont pas besoin d'autant de calcul,

12:43mais qui ont ces mémoires dedans.

12:45Pourquoi je vous dis ça ?

12:47Parce qu'on a en France un acteur qui s'appelle SeaPearl.

12:50Pour l'instant, il ne vende pas, il ne produit pas pour l'instant,

12:54mais c'est le seul qui va créer une puce qui, comme ça, ne va pas beaucoup calculer pour entraîner,

13:02mais va avoir cette mémoire qui va permettre à peu, normalement à pas cher,

13:07et en plus qui soit européenne.

13:09Et c'est un projet qui est financé par des projets européens.

13:12C'est France 2030, je crois, en partie.

13:15Donc, ça, c'est une option qui vous semble rassurante.

13:19Oui, qui est excitante.

13:21Bon, d'accord.

13:22Mais je pense, en revanche, il y a un point que je voudrais faire qui est édyptique.

13:27Ce n'est pas une rupture de génération.

13:29C'est-à-dire qu'en termes de performance, c'est un peu la même chose,

13:32mais c'est comme vous aviez les mêmes ingrédients et ça a été un super cuisinier qui a réussi à faire.

13:37Mais l'IA, en général, est toujours en mouvement.

13:41C'est-à-dire que la qualité des LLM, des LMM, donc Large Multi Model Models et autres,

13:48fait que nous allons aller vers une autre génération.

13:51C'est-à-dire que là, on n'est plus sur uniquement les modèles qui ne résonnent pas.

13:55On arrive aussi à des modèles qui résonnent.

13:57On va avoir des questions sur quel est le niveau d'intelligence dont on a besoin

14:01en fonction de la tâche que l'on donne.

14:05On n'a pas besoin de la même voiture pour amener ses enfants à l'école

14:08et puis pour faire la route, partir en vacances.

14:11C'est un petit peu ça qui va arriver.

14:13Et ça, on est dans une nouvelle étape de recherche

14:16qui va nécessiter énormément de ces puces très sophistiquées.

14:21Pour ajouter un point là-dessus, en fait, vers quoi on va ?

14:24On va vers ce qu'ils appellent l'IA agentique.

14:27L'IA agentique, qu'est-ce que ça va être ?

14:29Vous allez poser votre question à une IA.

14:31Et en fait, l'IA, plutôt que de vous répondre, plutôt que d'avoir un très gros modèle,

14:34elle va chercher elle-même toute seule sur Internet

14:37les autres agents qui sont spécialisés.

14:39Et elle va découper votre prompt en dix parties.

14:42Et chaque partie va être traitée par un agent, par une autre IA quelque part,

14:47hébergée chez quelqu'un d'autre.

14:49Donc, ça va beaucoup là-dedans.

14:52Effectivement, vous avez raison.

14:53Ça va aller au-delà d'avoir des puces.

14:55Il va falloir avoir des réseaux très rapides pour que ces IA communiquent.

14:59J'étais chez Cisco la semaine dernière.

15:01Ils travaillent beaucoup là-dessus.

15:02Et ils m'ont dit qu'il y a un truc extraordinaire.

15:04C'est que le Web3, le machin qui n'a jamais marché,

15:09en fait, grâce à cette IA agentique où les agents vont communiquer entre eux,

15:12ils vont devoir communiquer.

15:13Ils vont devoir s'identifier avec des blockchains.

15:15Et donc, ça va être la renaissance du Web3.

15:19Ils ont investi là-dedans pour rien.

15:21Totalement inorganique.

15:23Et principalement inorganique.

15:25C'est quelque chose.

15:27Ils vont créer leur Web3 à eux, les agents, entre guillemets.

15:30Oui, c'est ça.

15:31Bon, alors après, selon Cisco, il faut que ce soit ouvert.

15:34Là, on s'aperçoit, comme vous l'avez dit, François,

15:36qu'on a vraiment un problème très physique, très matériel aujourd'hui dans l'IA.

15:40Est-ce que vous êtes quand même optimiste avec les 109 milliards ?

15:44Et on doit rajouter quand même les 200 milliards d'euros au niveau de la Commission européenne.

15:48Est-ce que vous dites, là, on avance, parce que c'est justement pour des infrastructures physiques.

15:54Oui, absolument.

15:55Je dirais, est-ce que je suis optimiste ?

15:57C'est très bien qu'il y ait ces annonces.

15:59Maintenant, entre les annonces de la coupe aux lèvres,

16:02il se passe pas mal de choses.

16:04Donc, j'espère simplement que la coupe atteindra les lèvres.

16:07En fait, il faut un peu se méfier de ces annonces.

16:11On met de l'argent sur la table.

16:13Est-ce que c'est pour investir et puis après en tirer des dividendes de ce qui va créer 0 PIB ?

16:18Ou est-ce que c'est pour véritablement construire quelque chose ?

16:20Si on n'a pas les puces, on ne va pas construire grand-chose.

16:22Moi, j'aime bien l'approche européenne qui a été un peu différente de ce qu'on a fait, nous, en France

16:26et de ce qu'ont fait les Etats-Unis,

16:28qui est de dire, nous, en fait, on ne va pas investir que dans les GPU.

16:31On va aussi investir dans le stockage de données, dans les réseaux,

16:34parce que c'est ça, demain, le détail technique sur lequel l'IA va reposer.

16:41Parce que le stockage, c'est hyper important.

16:44Vous avez des puces qui traitent très vite vos informations.

16:48Mais les entreprises, elles veulent donner à manger,

16:51elles veulent injecter leurs propres données pour que l'IA leur réponde sur leurs besoins métiers.

16:55Mais si elles sont incapables d'injecter les données très rapidement,

16:58finalement, vous avez des puces très puissantes qui tournent à vide.

17:01Donc, en fait, on ne se rend pas compte,

17:03mais le stockage, c'est véritablement le nerf de la guerre après les GPU.

17:07Mais c'est pour ça, je pense qu'il y a la partie technique, la partie physique.

17:12Mais la partie, et moi, ce qui me frappe, c'est le retard que prennent nos entreprises dans l'adoption.

17:17Et ça, c'est un vrai souci.

17:19Et c'est pour ça que je trouve que...

17:21Elles font partie du maillon de la chaîne.

17:23Mais elles sont au cœur, parce que, d'une certaine manière,

17:26ce sont à elles de créer de la valeur, au-delà d'avoir des puces.

17:29Si les puces tournent à vide, si on ne sait pas les utiliser...

17:32Si on n'a pas de cas d'usage.

17:34Si on n'a pas de cas d'usage, ou si on ne crée pas de valeur avec.

17:37Je ne suis pas sûr que les cas d'usage soient la bonne option.

17:39Mais je pense qu'il faut redessiner davantage les processus.

17:42Il faut moderniser nos entreprises.

17:44Et c'est un gros travail de mise en œuvre de connaissances,

17:48de s'assurer que chacun réussit à, effectivement, redessiner ses processus.

17:53Le fait qu'on ait moins de frustrations et de frais de restructuration.

17:58Ça fait quand même beaucoup de conditions.

18:00Je vous invite à découvrir la dernière couverture de Diplomatie Magazine.

18:05Son grand dossier parle de géopolitique des migrations.

18:09Vous y trouverez aussi un dossier sur la cyber et lié au cœur des enjeux.

18:14Excellente magazine pour comprendre tous ces enjeux géopolitiques,

18:17notamment autour du numérique.

18:19Merci beaucoup à tous les deux.

18:21Yann Serra et François Candelon.

Recommandations

12:49

À suivre

SMART BOURSE - Observatoire ETF : les dernières tendances

B SMART