De plus en plus utilisés à la place des moteurs de recherche, les chatbots d’IA reconditionnent l’information, sans toujours en citer l’origine. Résultat : moins de trafic vers les sites d’actu, des propos parfois déformés et des auteurs souvent invisibilisés. Une dérive pointée du doigt par le Columbia Journalism Review, qui alerte sur l’absence de garanties, même en cas de licence de contenu.
Catégorie
🗞
NewsTranscription
00:00C'est parti pour le grand rendez-vous de l'IA, de l'intelligence artificielle dans Smartech.
00:08Aujourd'hui, autour de la table, Charles Martinet. Bonjour.
00:10Bonjour.
00:11Vous êtes responsable des politiques au Centre pour la sécurité de l'IA, le CESIA.
00:16Vous élaborez des recommandations pour la gouvernance internationale et européenne de l'IA.
00:21Vous êtes également chercheur affilié à l'Oxford Martin AI Gouvernance Initiative.
00:25Et vous avez été Summer Fellow au Centre for the Governance of AI.
00:30Merci d'être avec nous.
00:31A côté de vous, Guylain Deperfieux. Bonjour.
00:34Bonjour.
00:34Partner chez WaveStone. Vous dirigez les activités liées à la donnée et à l'IA.
00:39Vous accompagnez les grandes entreprises, tous secteurs confondus, dans cette transformation vers l'intelligence artificielle,
00:44de la stratégie au développement d'algorithmes de machine learning.
00:47Alors, on va commencer avec cet article, moi, qui m'a passionnée, vraiment, même beaucoup interpellée.
00:53C'est ces intelligences artificielles qui ont du mal, finalement, c'est le moins qu'on puisse dire, à citer leurs sources.
00:59C'est un article qui a été publié par Columbia Journalism Review, tout début du mois de mars.
01:05Et on découvre, à travers les travaux du Toe Center for Digital Journalism,
01:10alors d'abord, on entend que près d'un Américain sur quatre déclare désormais avoir utilisé l'IA à la place des moteurs de recherche traditionnels.
01:18Et on découvre que sur huit outils que tout le monde connaît aujourd'hui d'intelligence artificielle qui savent faire de la recherche,
01:26enfin, qui sont censés savoir le faire, on parle de Perplexity Pro, de Grok 2 et 3 Grok Search, de ChatGPT Search, de Copilot, de Jiminy, de DeepSeek,
01:36Et bien, quand on évalue leur capacité à citer des sources, c'est une catastrophe.
01:43Alors, j'irai peut-être plus en avant dans le détail, si vous voulez, mais une première réaction, déjà, de votre part, m'intéresse.
01:49Oui, tout à fait. Alors, ce qui est assez intéressant, c'est que c'est une tendance qui remonte quand même à quelques années.
01:54C'est-à-dire qu'on constate depuis plusieurs années maintenant que les systèmes d'IA ont tendance à ce qu'on appelle halluciner,
02:00c'est-à-dire qu'ils génèrent des fausses informations.
02:03Dans ce cas-là, dans cette étude, on voit par exemple Grok, qui vient de XAI, l'entreprise d'Elon Musk,
02:08qui, dans ses réponses, fournit des fausses informations 94% du temps, ce qui est quand même absolument énorme.
02:16Pour un système ou des fausses sources, en fait, parce que je voulais te rappeler quand même la méthodologie.
02:22Donc, en fait, les chercheurs ont fourni à chaque IA des extraits d'articles de médias
02:27qui, quand on les met dans un moteur de recherche traditionnel, en l'occurrence celui de Google,
02:32dans les trois premiers résultats, on obtient les articles avec leurs sources directes, les articles d'origine.
02:38Et donc, ils ont demandé aux IA d'identifier à partir de ces extraits le titre,
02:42de fournir la date de publication et l'URL avec le nom de l'éditeur.
02:48Donc, de retrouver la véritable source.
02:50Et vous nous rappelez, donc, que dans Grok, dans 96% des cas, c'est un échec.
02:5494% des cas, pour Grok, en tout cas, c'est un échec.
02:58Donc, ça montre quand même, encore une fois, cette tendance à halluciner.
03:01Et ce qui est assez inquiétant, c'est que, pour le coup, en France,
03:03c'est la majorité des 18-25 ans qui disent maintenant accéder à l'information
03:09ou avoir utilisé au moins des systèmes d'IA pour accéder à l'information.
03:14Ce qui est inquiétant quand on constate, du coup, cette tendance à halluciner.
03:17Ça montre aussi autre chose.
03:20Ça montre la limite des systèmes d'IA.
03:21Ça ne concerne pas que l'hallucination.
03:23Ça concerne tout un tas d'autres questions de sécurité.
03:26Après, il faut aussi prendre un petit peu de recul.
03:28C'est-à-dire que la vitesse des progrès en IA va si rapidement
03:31que des limites qui étaient présentes il y a un an
03:34peuvent ne pas l'être dans un an.
03:35C'est vrai.
03:36On a vu, par exemple, l'exemple des systèmes d'IA de génération d'images
03:40qui montraient au début des personnes avec des mains à six doigts, par exemple.
03:45Et ça a été un problème pendant très longtemps.
03:47Et maintenant, on voit que ce problème est totalement résolu.
03:50Pareil sur les systèmes de génération d'images.
03:52C'était impossible, jusqu'à il y a quelques mois,
03:55de générer une image avec des mots de manière fiable,
03:57de mettre des phrases entières.
04:00Maintenant, c'est résolu aussi.
04:00Donc, il faut aussi anticiper et comprendre que ce sont des limites
04:05qui sont pour l'instant structurelles, mais qui pourraient être résolues bientôt.
04:08Oui, c'est une photographie, en fait.
04:10Alors que tout ça est tout le temps en mouvement.
04:12C'est vrai, c'est important de le rappeler.
04:14Guylain ?
04:15En fait, il faut revenir à la base.
04:16C'est-à-dire que là, on parle d'IA générative.
04:19Le propre de l'IA générative et pas de chercher, c'est de générer.
04:22C'est vrai.
04:23C'est comme si on essayait d'utiliser la zone du cerveau propre au langage
04:27pour faire des calculs.
04:27Donc, le problème, c'est ça, c'est qu'on essaie de prétendre qu'on a des IA générales
04:30qui sont capables de résoudre tous les problèmes que le cerveau humain sait résoudre.
04:33C'est faux.
04:34Les IA génératives, elles sont très fortes pour parler, parfois trop, parfois mal, etc.
04:38Elles sont très mauvaises pour chercher de l'information précisément, en fait.
04:43Et du coup, toute la question, et aujourd'hui, ça n'a pas été fait,
04:45c'est comment on fait pour combiner des IA, on va dire, traditionnelles,
04:49celles qu'utilise Google pour son moteur de recherche, pour mettre en haut de la base.
04:53Donc, il y a une partie qui est liée à la pub et à combien on paye pour...
04:56Voilà.
04:56Mais il y a une partie aussi qui est liée à la précision du contenu par rapport à la recherche.
05:01Et du coup, il y a une idée qui était celle de Google à la base,
05:05de dire, dès que vous tapez un prompt et que vous posez une question à Gemini,
05:09et en l'occurrence, on pourrait l'imaginer sur d'autres,
05:11d'abord, on va activer les IA traditionnelles, et si on n'a pas de résultats suffisamment satisfaisants,
05:16ou si on veut d'autres choses, c'est-à-dire faire une synthèse du document,
05:18alors on va chercher l'IA génératif, qui est très forte pour ça.
05:21Et là, aujourd'hui, on essaie d'utiliser la même zone du cerveau pour tous les usages possibles.
05:26Et ça ne fonctionne pas.
05:27Alors, je suis d'accord, ça va progresser, on va trouver des façons de le faire.
05:30Et d'ailleurs, ils vont intégrer cette logique un peu multi-agent dans leurs outils
05:33pour, j'allais dire, débrayer et aller chercher des IA un peu plus performantes,
05:37voire pas des IA du tout, de temps en temps,
05:38pour certaines parties ou certaines tâches qui sont des décompositions de la tâche globale
05:44qu'on lui demande de réaliser.
05:45Alors, c'est une mauvaise nouvelle pour les utilisateurs,
05:50parce que, du coup, on s'aperçoit quand même qu'il faut faire très, très attention
05:54avec les résultats qui sont proposés par ces IA génératives.
05:57Mais c'est une mauvaise nouvelle.
05:59Alors là, pour le coup, une très mauvaise nouvelle pour les éditeurs de presse,
06:02pour les médias, puisque si on n'est plus capable de renvoyer vers la source d'origine,
06:08c'est des revenus importants, en fait, qui disparaissent.
06:12En revanche, c'est une bonne nouvelle pour les moteurs de recherche.
06:15Oui.
06:15Parce que ça veut dire, finalement, on n'est pas encore dans cette phase de remplacement
06:19par les IA génératives.
06:21En fait, si les gens ne sont pas suffisamment feignants
06:23pour ne pas se contenter de mauvais résultats,
06:25oui, c'est une bonne nouvelle.
06:26Non, et aujourd'hui, c'est pour moi le point le plus préoccupant.
06:29C'est qu'effectivement, les jeunes, et pas qu'aux Etats-Unis, y compris en France,
06:32utilisent beaucoup ces outils comme la vérité absolue
06:34et comme une façon facile de ne pas avoir à raisonner.
06:37Or, ces outils sont des outils informatiques assez complexes
06:40et il faut savoir leur parler.
06:42Il faut savoir les prompter, les prompter dans l'ordre,
06:44avec une chaîne de pensée, si vous voulez qu'ils soient précis
06:46dans les réponses qu'ils vont vous faire.
06:47Et en fait, même cette étape, souvent, on l'oublie un peu.
06:50Et dans le cas et l'étude qui a été faite, c'est un peu ça.
06:52Je demande une question très générique,
06:53mais je ne guide pas le moteur, enfin l'intelligence artificielle,
06:57pour qu'elle me donne les bonnes réponses.
06:58Et du coup, il y a un vrai sujet de formation et d'habitude des utilisateurs
07:02pour savoir, finalement, apprendre à parler un peu le langage informatique,
07:07à décortiquer son raisonnement et à le faire travailler par étapes.
07:11Et là, on aura des résultats qui seront un peu plus probants.
07:13Moi, j'avais même proposé, comme ça à personne en particulier,
07:18mais de manière générale, qu'il y ait un message qui alerte pour dire
07:22je ne suis pas un moteur de recherche,
07:26je ne fais que générer des réponses à partir de choses que je collecte.
07:30Parce que ce qui est perturbant, quand même,
07:32mais ça permet de comprendre le mode de fonctionnement de ces IA génératives,
07:35Charles, j'imagine, c'est ce que vous allez me répondre.
07:38Mais ce qui est perturbant, c'est qu'il n'alerte pas forcément
07:41sur le fait qu'il n'a pas réussi à trouver la source.
07:44Il est capable d'en inventer, d'inventer même des URL.
07:47Tout à fait, tout à fait.
07:48Et c'est encore un problème aujourd'hui.
07:50Il y a aussi une question.
07:51Donc, certaines IA, comme Tchad GPT, par exemple,
07:53mettent un petit message comme quoi
07:55il faut vérifier la véracité des informations données.
07:58Mais les entreprises, d'IA de manière générale,
08:01ne font pas d'efforts particuliers de communication
08:04pour faire comprendre aux gens
08:05que ce ne sont pas une source de vérité.
08:09Donc, il y a un effort à faire de ce point de vue-là.
08:11Il y a aussi un effort à faire pour les entreprises de l'IA.
08:13Il y a un effort qu'il faudrait contraindre
08:15par des règles internationales,
08:18puisque vous travaillez sur ces sujets-là.
08:19Exactement.
08:20Il y a actuellement déjà des règles
08:22qui sont en train d'être mises en place au niveau européen.
08:25avec l'IA qui a été passé l'année dernière
08:28et maintenant un code de bonne pratique
08:30qui s'applique particulièrement aux fournisseurs
08:31des plus grands modèles.
08:33Et notamment, une des règles qui est contenue
08:35dans ce code de bonne pratique,
08:37c'est l'obligation d'évaluer ces modèles,
08:39c'est-à-dire de regarder, de les tester,
08:40de regarder leur performance,
08:42de regarder leur sécurité.
08:44Et cette obligation d'évaluation,
08:46elle est importante,
08:47parce qu'aujourd'hui,
08:48il y a une pression au déploiement qui est très forte.
08:50C'est-à-dire qu'on est dans une dynamique de course
08:52où chaque entreprise va essayer de sortir un modèle
08:54avant les autres,
08:56ce qui fait que le temps passé à tester les modèles
08:59est réduit.
09:02Les entreprises sont incitées
09:04à ne pas passer trop de temps à tester ces modèles.
09:06Il y a moins de principes de précaution.
09:09Alors, je voulais vous faire réagir aussi
09:10sur cette actualité très franco-française.
09:12C'est Mistralaya qui a signé un partenariat
09:14sur cinq ans avec CMA, CGM.
09:19Donc, une vingtaine de salariés
09:20vont aller travailler de la start-up Mistralaya
09:22et qui vont aller travailler vraiment au sein du groupe,
09:26dans les locaux,
09:26pour déployer des solutions sur mesure.
09:28Comment vous voyez ce deal, vous,
09:31du point de vue du consultant ?
09:34Il se passe quelque chose d'important aujourd'hui en France ?
09:37Oui, en fait, c'est une excellente nouvelle pour moi
09:38parce que, j'allais dire,
09:39pour la première fois depuis bien longtemps,
09:41on a un partenariat entre une société européenne,
09:43en l'occurrence française et une grande société française,
09:47sur la base de l'envie
09:48et de la désirabilité du produit
09:50et de ce qu'a construit Mistral.
09:52Et ça, c'est génial.
09:53C'est-à-dire qu'ils ont réussi à construire
09:54quelque chose qui donne envie.
09:56Et on n'est pas dans une logique
09:57où on impose par la norme
09:58ou on impose par plein d'autres moyens
10:01la souveraineté ou la peur.
10:02On est dans une entreprise qui a envie.
10:05Alors, ça ne veut pas dire qu'ils ne font que ça,
10:06CMA, CGM.
10:07Ils font plein d'autres choses avec Google.
10:08Ils l'avaient annoncé un peu plus tôt
10:09sur des sujets plus, on va dire,
10:11moins souverains ou moins dangereux.
10:12Et ils travaillent déjà beaucoup
10:14avec les clouders américains
10:15et ils vont continuer et c'est très bien.
10:17Donc, ils avancent, ils vont vite, ils vont fort.
10:19Mais là, ils se disent, j'ai une pépite,
10:20ce serait vraiment dommage de ne pas l'utiliser.
10:22Et donc, on va construire quelque chose ensemble.
10:24Et ce n'est pas les seuls.
10:26Il y a pas mal d'autres entreprises
10:27et administrations françaises
10:29qui ont entamé ou qui avaient entamé
10:31des discussions avec eux.
10:33Et donc, je trouve qu'on est sur un mouv'
10:34qui est super intéressant
10:35où vraiment, on va commencer à construire quelque chose,
10:38encore une fois, sur la base de l'envie
10:39et pas sur la base de l'obligation.
10:41La désirabilité de nos entreprises françaises.
10:44Effectivement, dans la tech, c'est important.
10:46Un mot là-dessus.
10:47En fait, ils vont commencer à travailler
10:48sur la relation client et puis le fact-checking.
10:51C'est ça, exactement.
10:51Donc, il y a deux versants principaux.
10:53Il y a pour les aspects service client,
10:55gestion de la documentation logistique
10:57et un aspect fact-checking.
10:59Ce qui est intéressant aussi,
11:01c'est que ça montre l'utilité d'intégrer
11:03l'IA concrètement dans des cas d'usage
11:05qui sont précis,
11:06qui répondent à des besoins métiers concrets.
11:07C'est-à-dire qu'il ne suffit pas
11:09de créer des grands modèles de langage.
11:11Il faut aussi les adapter et les intégrer
11:12dans les process des entreprises de tous les jours.
11:15Alors, autre actualité,
11:16c'est cette loi de simplification
11:17qui est en ce moment étudiée
11:20en examen à l'Assemblée nationale
11:22et qui contient un article 15,
11:25pour être précise,
11:27qui va autoriser le gouvernement
11:29à octroyer au projet de construction
11:31de très gros data centers.
11:32On parle de surface entre 30 et 50 hectares.
11:36Eh bien, une facilité.
11:38En fait, ils seront sous un label
11:40de projet d'intérêt national.
11:41Il y a des mouvements de résistance,
11:43là, j'ai vu, qui s'organisent.
11:44On a le collectif Le Nuage sous nos pieds,
11:47la quadrature du Net, IATUS,
11:49qui appelle à la suppression
11:50de cet article 15.
11:51Quel est votre sentiment là-dessus ?
11:54Il faut arrêter la course au gigantisme
11:55ou au contraire, la France, là,
11:57elle a du retard,
11:57donc il faut qu'elle y aille plus vite ?
12:00Alors, c'est une bonne question.
12:01Il y a effectivement
12:02un enjeu quand même de souveraineté,
12:04c'est-à-dire qu'il y a un besoin
12:06en France d'avoir des data centers
12:08qui sont compétitifs
12:09et qui sont efficaces,
12:10en maintenant quand même
12:12des normes environnementales
12:14d'efficacité et de sobriété.
12:17Après, ce qui est aussi important,
12:19ce n'est pas tant
12:19où sont les centres,
12:22les data centers,
12:23c'est aussi notre capacité
12:24et la capacité des entreprises françaises
12:25à y accéder
12:26et aussi ce qu'on fait
12:28avec cette puissance de calcul.
12:29C'est-à-dire que si on utilise
12:31cette puissance de calcul
12:33pour des applications
12:34qui n'ont pas d'avantages
12:35soit économiques,
12:36soit sociétaux,
12:37c'est quand même dommage.
12:39Il y a aussi une question
12:39en fait de conditionnalité
12:42qui n'est pas présente pour le coup
12:43dans le projet de loi simplification
12:44parce que l'idée,
12:44c'est justement d'enlever les normes.
12:48Il y a une question
12:48de faire en sorte
12:49que la puissance de calcul
12:50soit utilisée
12:51à des fins bénéfiques
12:52pour la société.
12:54Moi, je l'ai déjà dit
12:55sur cette antenne,
12:56je ne suis pas un fan
12:57de la course au gigantisme
12:58sur ce sujet des data centers.
13:00Il y a des choses à faire,
13:01on a pris du retard,
13:01il faut en construire,
13:02donc je trouve ça bien
13:03d'aller vite
13:03et pas de prendre trois ans
13:04si on veut en construire un.
13:05Donc je pense qu'il faut accélérer,
13:07je pense qu'il faut le faire
13:07et aujourd'hui,
13:09on a ce qu'il faut
13:11ou on aura ce qu'il faut
13:12pour le besoin des entreprises.
13:15On n'a pas besoin
13:15de giga data centers
13:16pour la plupart des cas d'usage.
13:18On parlait de CMAC,
13:20GM et Mistral,
13:20ils sont capables
13:21de traiter la plupart
13:21des cas d'usage.
13:22Il y a des énormes volumes
13:23de données sans forcément
13:24avoir des giga data centers.
13:25Le problème qu'on a aujourd'hui,
13:27c'est l'usage grand public
13:28et finalement,
13:29ça pose des questions aussi.
13:30C'est-à-dire qu'aujourd'hui,
13:32pourquoi Microsoft,
13:33pourquoi Google,
13:34pourquoi Amazon
13:35ont besoin de faire grossir
13:37leur data center à ce point-là ?
13:38C'est par les usages grand public
13:39de l'IA génératif
13:40qui sont énormes.
13:41Vous avez tous vu
13:42les petites figurines personnelles
13:43sur LinkedIn, etc.
13:45Les usages dont on peut douter
13:46de la valeur ajoutée
13:47pour la société,
13:48mais néanmoins
13:48qui sont très, très, très utilisés
13:50et ça, ça génère
13:51des besoins énormes
13:53en data center.
13:54Et du coup,
13:54si c'est pour faire ça,
13:55effectivement,
13:55moi, je pense que
13:57ce n'est pas la bonne voie
13:58et pour autant,
13:59on peut se poser la question
14:00parce que si on ne le fait pas,
14:01les gens le veulent.
14:02Et est-ce qu'on préfère finalement
14:03qu'ils utilisent
14:03ChatGPT ou Grock
14:05pour poser des questions, etc.
14:08et potentiellement d'ailleurs
14:08se faire manipuler un peu
14:10ou est-ce qu'on préfère
14:11qu'ils utilisent le chat
14:12sur des gros data centers français ?
14:14Et donc, la question,
14:15elle est beaucoup plus compliquée
14:16que ça
14:17et elle est beaucoup liée
14:17aux usages.
14:18Et en favorisant
14:19les très gros data centers,
14:20est-ce qu'on ne favorise pas
14:21de fait aussi
14:22les hyperscalers ?
14:24C'est l'autre question.
14:26C'est l'autre question.
14:27Pour moi,
14:28ce serait super.
14:28En tout cas,
14:29il ne faut surtout pas
14:29qu'on bloque
14:30les acteurs français
14:31du cloud
14:32qui sont en difficulté
14:34depuis des années,
14:35qui essaient de percer.
14:36Je pense qu'ils ont
14:36une opportunité un peu unique
14:37avec les questions
14:38de souveraineté
14:39de vraiment percer.
14:40Il ne faut surtout pas
14:40les bloquer.
14:41Il faut qu'on les aide
14:41à aller vite
14:42et peut-être pas
14:43qu'on aide de trop
14:44les Américains
14:45quand on voit aujourd'hui
14:46les tensions
14:46qu'il peut y avoir
14:47sur un certain nombre de sujets.
14:48Au-delà même
14:49de la préoccupation
14:50environnementale,
14:50il y a quand même
14:51plusieurs points d'alerte
14:52je pense pour les députés
14:53qui nous écoutent,
14:54on espère.
14:56Autre information,
14:57Charles,
14:57que vous aviez relevée,
14:58c'était cette division
15:00en Europe
15:01autour de ce projet
15:02de CERN
15:03d'organisation
15:04européenne
15:05autour de la recherche
15:07sur l'intelligence artificielle.
15:08Tout à fait.
15:09En fait,
15:09c'est un débat
15:09qui revient assez souvent
15:10depuis quelques années maintenant
15:11avec l'idée
15:12que l'Europe a des forces
15:14et les pays européens
15:15doivent collaborer ensemble
15:16pour essayer de rattraper
15:18leur retard
15:18face aux alternatives.
15:21Donc c'est un débat
15:21qui revient.
15:22On commence à avoir
15:23des embryons
15:23de CERN pour l'IA,
15:24des initiatives.
15:25Il y a la Commission européenne
15:26qui a annoncé une initiative
15:27des usines pour l'IA,
15:28Air Factories.
15:30Il y a aussi
15:31des projets d'investissement massifs
15:32qui ont été annoncés
15:33lors du sommet
15:34pour l'action sur l'IA
15:35et récemment aussi.
15:37Donc il y a cette question
15:38de développer
15:40une alternative européenne.
15:42Et pourquoi ça divise ?
15:43Qu'est-ce qui divise ?
15:44Alors il y a plusieurs aspects
15:44qui divisent.
15:45Pour certains,
15:45ce n'est pas le rôle
15:46de la puissance publique
15:47de favoriser le développement
15:48d'une IA.
15:50C'est vrai qu'il n'y a pas forcément
15:50une défaillance de marché
15:51en ce moment
15:52sur le développement de l'IA.
15:55Par contre,
15:55l'aspect sur lequel
15:56il y a une défaillance de marché,
15:57c'est justement
15:57la question de la sécurité
15:59et le développement
16:00d'une IA sûre.
16:01Et c'est là que pour certains,
16:03il y a un rôle pour l'Europe
16:04de développer
16:05une infrastructure de calcul
16:06qui peut être utilisée
16:07par des chercheurs,
16:08par des PME,
16:09par aussi des grandes entreprises.
16:10Pourquoi pas ?
16:11Si elles le font
16:13d'une manière sécurisée
16:14est sûre et bénéfique.
16:17Merci beaucoup
16:17à tous les deux
16:18pour vos éclairages.
16:19Je rappelle qu'on était
16:20en compagnie de Guylain,
16:21de Pierre Feux,
16:22expert en IA
16:22au sein du cabinet
16:23WaveStone,
16:24et de Charles Martinet,
16:25responsable des relations
16:26institutionnelles
16:27au CESIA.
16:28Merci encore.
16:29Merci, merci.