SMART TECH - Emission du mardi 24 septembre - Vidéo Dailymotion

B SMART

Mardi 24 septembre 2024, SMART TECH reçoit Jérôme Valat (CEO et cofondateur, Cleyrop) , Yann Padova (avocat associé, Wilson Sonsini) , Murielle Popa-Fabre (experte en traitement automatique du langage, Conseil de l'Europe) et Jérôme Bouteiller (Fondateur, EcranMobile)

Transcript

00:00Bonjour à tous, grand rendez-vous sur l'intelligence artificielle aujourd'hui dans Smartech.

00:12Alors on va s'intéresser à l'utilisation des données personnelles des Européens pour entraîner ces grands modèles d'intelligence artificielle,

00:19alors qu'une enquête vise actuellement Google à ce sujet.

00:22Et puis cette question, peut-on encore lancer une startup d'IA ?

00:26Et bien oui, parce que les géants auraient peut-être déjà tué le game.

00:29On terminera avec les avis des pros sur les nouveaux modèles qui ont été dévoilés, les nouveaux modèles d'IA.

00:36Ça c'est donc notre grand rendez-vous.

00:38Je vous propose aussi dans cette édition un focus sur le business du mobile.

00:43Je ne sais pas si vous avez entendu parler de Distraction Control,

00:46cette nouvelle fonctionnalité qui est en fait un bloqueur de pop-up dans les iPhones.

00:51Voilà pour le programme.

00:57Pour ce grand rendez-vous de l'IA dans Smartech, j'ai convié Jérôme Ballac, cofondateur de Clérop.

01:03Clérop, plateforme data et IA clé en main, conçue pour démultiplier simplement les usages autour de la donnée.

01:09Bonjour Jérôme.

01:10Bonjour.

01:11Avec vous Muriel Popafab, vous êtes experte au Conseil de l'Europe,

01:15vous intervenez sur les questions de réglementation de l'intelligence artificielle et de protection des données.

01:20Bienvenue également Muriel.

01:22Et puis à côté de vous, Yann Padova, ancien de la CNIL et avocat aujourd'hui au barreau de Paris et Bruxelles, associé chez Wilson.

01:30Bienvenue également Yann.

01:32Je vous propose qu'on démarre avec ce premier sujet.

01:35C'est une enquête européenne qui a été ouverte sur l'utilisation des données personnelles des utilisateurs européens

01:41pour développer un des modèles d'intelligence artificielle de Google, Palm 2, qui date quand même de l'année dernière.

01:49Alors cette enquête doit déterminer si Google a respecté les obligations qu'elle aurait pu avoir de réaliser notamment une étude d'impact

01:57destinée à garantir la protection des droits et libertés fondamentaux des individus.

02:02Muriel, ma question en fait c'est, quoi cette étude d'impact ?

02:07Alors les études d'impact, c'est un sujet assez compliqué et qui en train vraiment de prendre forme actuellement.

02:14Notamment au Conseil de l'Europe pour comprendre quel est l'impact sur les droits fondamentaux de l'utilisation des outils à base d'intelligence artificielle.

02:24Et d'une certaine façon il faut dire qu'on sait depuis désormais 4 ans qu'on peut extraire des signatures d'adresse mail des modèles de langage.

02:35Donc c'est pas nouveau du modèle de Google. Il y a des études qui sont en science ouverte, qui ont été publiées.

02:43Et cette recherche de fond de comment on extrait des données qui sont mémorisées à l'intérieur des modèles de langage,

02:53et plus particulièrement de l'architecture transformateur, existe depuis 2018-2019.

02:57D'accord, donc ça veut dire que les grands acteurs de l'IA aujourd'hui ont des outils pour réaliser leurs études d'impact.

03:03Il y a des outils pour savoir et pour extraire de l'information des LLM.

03:08Juste un point, c'est une étude d'impact, pour préciser ce qu'a dit Muriel, au sens du RGPD.

03:13Savoir que c'est une étude qui doit mettre en balance les droits et libertés des personnes et l'intérêt commercial et business de l'entreprise,

03:20et arriver justement à montrer qu'il n'y a pas de disproportion et que les droits et libertés sont maintenus.

03:25C'est une obligation du RGPD, et c'est l'autorité irlandaise qui lance l'enquête, parce que l'établissement principal de Google est en Irlande.

03:32C'est aussi que la commission de protection des données personnelles irlandaise travaille pour l'ensemble des CNIL européennes.

03:39Elle a cette compétence au niveau de l'Europe, et donc c'est une enquête qui est assez limitée dans son champ,

03:43parce que c'est une enquête qui est quasi documentaire.

03:45Il y a une obligation de faire une étude d'impact au sens du RGPD.

03:48Est-ce que Google l'a bien faite ?

03:50Et est-ce que les droits et libertés des personnes sont bien balancés et sont respectés ?

03:54Donc là on est sur un règlement, vous avez dit le RGPD, qui est bien avant l'IACT.

04:00On n'est pas sur une obligation tout à fait récente.

04:03Vous dites aussi qu'on a déjà des indicateurs.

04:06Pourquoi cette enquête se porte spécifiquement sur Palm 2 ?

04:09Est-ce que Gémini, est-ce que les nouveaux modèles d'IA vous semblent poser moins de problèmes ?

04:14Ou on n'a pas eu le temps de regarder de près encore ?

04:16Il y a d'autres enquêtes de l'autorité irlandaise sur d'autres grands acteurs américains

04:22qui ont leur établissement principal en Europe, en Irlande.

04:26Meta, également l'objet d'une enquête, Google maintenant.

04:30Il y en a sûrement parce que tout n'est pas public.

04:32Mais je sais qu'il y en a d'autres.

04:34Il faut dire aussi que les études d'impact viennent de plusieurs pays,

04:42viennent de ratifier la convention cadre du Conseil d'Europe le 5 septembre,

04:46dont Israël, les Britanniques et aussi les Etats-Unis.

04:52Et à l'intérieur des obligations qui sont pour protéger de la discrimination,

04:59pour protéger le droit fondamental, l'état de droit et la démocratie,

05:02il y a ce type d'instrument et des outils de droit de recours si on est discriminé.

05:08Donc c'est quelque chose qui est présent aussi dans cette convention,

05:11qui vient d'être ratifiée.

05:13Et qui s'applique donc au-delà de l'Europe ?

05:15Qui s'applique au-delà de l'Europe.

05:17C'est très intéressant.

05:18J'ai un message très fort aussi qu'Israël a signé et que les Etats-Unis ont signé.

05:24La question que je voulais vous poser, Jérôme, c'est qu'aujourd'hui,

05:29puisque votre job en l'occurrence c'est de fournir des outils d'IA aux entreprises

05:33qui veulent s'y mettre pour brasser leurs data, en sortir de la donnée intelligente.

05:40Cette préoccupation justement de comment ont été nourries ces modèles de langage

05:46que vous, vous brassez, elle est présente ?

05:49Est-ce que vous avez une responsabilité, vous, quand vous êtes aussi un distributeur finalement ?

05:52Oui, le risque, il est réel.

05:55Et on en parlera peut-être plus tard.

05:57Mais l'EIAct vient, j'allais dire, un peu permettre d'échelonner,

06:01de différencier les différentes étapes d'usage d'un modèle.

06:05Et donc effectivement avec des responsabilités qui vont être attribuées,

06:07distribuées à chaque étage.

06:09Mais s'il y avait un esprit de taquin, ce que je n'ai pas,

06:12je m'étonne un peu aujourd'hui qu'on semble découvrir un peu la lumière.

06:19On a laissé, pour ne pas dire même offert, le marché numérique européen aux Américains.

06:26Alors qu'on a une décision de Cour Européenne de Justice en 2015

06:29qui nous disait déjà qu'il fallait être un peu prudent.

06:32Et donc aujourd'hui, ils ont les données européennes.

06:36Je crois que c'est 92% des données des entreprises européennes

06:38qui sont détenues par les Américains.

06:40Sur l'hébergement, vous parlez de l'hébergement ?

06:42Oui, sur l'hébergement.

06:43Et donc aujourd'hui, sur tous ces modèles-là,

06:45l'efficience de ces modèles va être directement dépendante

06:48du volume et de la qualité des données pour les entraîner.

06:51C'est quand même très tentant d'utiliser les données

06:53que vous avez à votre disposition pour le faire.

06:55Donc maintenant, on va devoir de nouveau,

06:57c'est un peu une spécialité européenne, courir un peu contre la montre

07:00pour essayer de récupérer des dérives que malheureusement on n'a pas anticipées.

07:04Là, c'est la question de l'hébergement des données

07:07par repenser notre marché du cloud.

07:11Mais certains disent que cette bataille est perdue.

07:14Alors oui, elle est très clairement perdue aujourd'hui.

07:17La question, c'est de savoir si elle est perdue définitivement.

07:19Et la question, c'est de savoir après les conséquences de cette défaite

07:22et de savoir si on continue de les accepter

07:24ou si à un moment donné, on décide qu'effectivement,

07:26on va devoir faire marche arrière.

07:28Mais ces données, elles sont anonymisées

07:31quand elles sont hébergées sur des clouds

07:34pour des utilisations d'entraînement d'IA ?

07:37Pas forcément anonymisées.

07:39Et il y a une autre bataille qui se mène en sous-main

07:42à l'intérieur des entreprises.

07:44Les autorités de protection des données européennes

07:46ont reçu dans la dernière année, beaucoup de lettres de la part d'employés

07:49qui ont vu arriver des assistants IA

07:52achetés sur étagère par leur employeur

07:54et on ne leur a pas demandé de valider les conditions d'utilisation.

07:59Donc il y a quelque chose qui se passe,

08:01je discutais la semaine dernière avec des représentants

08:03des syndicats internationaux,

08:05qui se passe sur la question de ce qu'on appelle en bon français

08:09le Workspace Data Surveillance.

08:13Donc la surveillance data à l'intérieur des entreprises

08:16qui est un vrai sujet à la fois au niveau de l'employeur

08:19et à la fois au niveau des données

08:22et de comment elles sont hébergées

08:23et surtout des conditions d'utilisation

08:25parce que c'est ça qui détermine.

08:27On valide très vite les conditions d'utilisation quand elles existent.

08:31Pour moi il y a deux questions.

08:33Il y a l'hébergement où la puissance des cloud étrangers américains

08:37est telle que le coût d'entrée et les investissements d'entrée

08:39ne sont pas rattrapables.

08:40Après il y a l'usage des données.

08:44Il y a le rapport Draghi qui est sorti il y a deux semaines

08:47qui dit qu'en termes d'innovation,

08:49l'Europe est en train de décrocher aussi, peut-être,

08:51et c'est l'ancien spécialiste du droit des données qui parle,

08:54peut-être parce qu'on a un cadre qui est trop restrictif

08:56sur l'utilisation des données et sur l'innovation.

08:59Il invite aussi à réfléchir sur le fait qu'en Europe,

09:02moi qui suis à Bruxelles, je le vois bien,

09:04on aime réguler, on aime même réglementer,

09:06peut-être un peu trop,

09:07et que l'innovation ne s'articule pas toujours très bien.

09:10Je ne vous ai pas vu dans les signataires de la tribune du jour.

09:14J'en ai fait un certain nombre.

09:16J'ai écrit dans des revues très savantes là-dessus

09:18depuis une dizaine d'années.

09:19L'équilibre entre l'innovation et la protection des données

09:23en Europe, c'est peut-être un peu trop déplacé,

09:25dans un sens, et ce n'est pas que moi qui le dis,

09:27moi je le dis depuis longtemps, Draghi le dit aussi aujourd'hui,

09:29et que l'utilisation, c'est ça où la richesse de la donnée

09:33va être révélée.

09:34C'est pour ça que les gros volumes sont nécessaires,

09:36mais aussi qu'on puisse faire des tests, etc.

09:38Et ça, aujourd'hui, c'est plus compliqué.

09:40Parce que là, ce que nous dit cette lettre ouverte,

09:42parue jeudi dans plusieurs quotidiens nationaux,

09:44avec une réglementation fragmentée,

09:47l'Union européenne prend le risque de passer

09:49à côté de l'ère de l'IA.

09:50Alors là, on est quand même dans cette difficulté

09:54de trouver la juste mesure entre la protection

09:58des données personnelles, s'assurer de la manière

10:01dont ces modèles d'intelligence artificielle sont nourris

10:05et utilisent les données personnelles ou non,

10:08et puis aussi laisser l'innovation,

10:11laisser des entreprises d'IA émerger,

10:13qui, elles, ont peut-être un petit peu de retard

10:15et n'ont pas déjà siphonné toutes les données

10:18comme ont pu le faire les grandes entreprises américaines.

10:21Muriel, comment vous réagissez à cette tribune ?

10:25La question de la compétitivité est au cœur

10:27du nouveau mandat de la Commission.

10:29Donc, il y a une très claire prise de conscience

10:32au niveau européen que la question de la souveraineté

10:34numérique est centrale, non seulement d'un point de vue

10:36réglementaire, mais aussi d'un point de vue de compétitivité.

10:38C'est ce qui ressort du rapport Draghi,

10:40mais c'est ce qui ressort des deux dernières années

10:42aussi de négociations du IACT.

10:44Il y a une prise de conscience généralisée

10:46sur la mutualisation de la puissance de calcul

10:49à travers les différents pays européens.

10:51Mistral a pu entraîner sur le supercalculateur italien.

10:54Donc, il y a quelque chose qui se passe

10:56au niveau de l'accès à la capacité de calcul.

10:58Il y a quelque chose qui est en train de bouger

11:00au niveau de créer des data hubs

11:02par verticale industrielle,

11:05ce qui devrait améliorer aussi l'arrivée des produits,

11:09c'est-à-dire pas simplement du modèle de fondation,

11:11mais de quelque chose qui a un impact sur l'industrie.

11:14Parce que la question de la compétitivité,

11:16c'est ça aussi.

11:18Donc, je pense que de façon générale,

11:21du point de vue des données et du calcul,

11:24cette prise de conscience est là.

11:26Un énorme investissement est en train d'arriver

11:29et des appels à projets ont été lancés

11:31au niveau de la Commission.

11:33Et l'organisme qui est censé implémenter

11:35le IACT au niveau européen,

11:37le AI Office à l'intérieur de la Commission,

11:39a vraiment une double casquette de promouvoir l'innovation

11:41et d'implémenter le IACT.

11:44C'est un cocktail qui trouve l'équilibre

11:49entre ces deux pôles de protection des citoyens européens

11:53et d'innovation fondamentale.

11:55Et c'est quelque chose qui joue sur l'échiquier géopolitique.

11:58Parce que c'est la question de la souveraineté.

12:00Cette question de compétitivité,

12:02elle se joue aussi au niveau de la manière

12:06dont sont fabriqués ces modèles d'IA.

12:08Parce qu'il y a une mission qui a été confiée

12:10à Alexandra Ben Samoun pour éclairer

12:12le gouvernement sur ses obligations

12:14des fabricants d'IA à dire

12:16quelles sont ces données utilisées

12:18pour entraîner leur modèle.

12:20Le rapport, on l'attend plutôt d'ici à la fin de l'année.

12:22C'est là que va se jouer aussi la capacité

12:24d'être compétitif ou non.

12:26Oui, surtout va se jouer la question

12:28de trouver ce juste équilibre.

12:30Parce que le IACT n'écrit pas

12:32quel est le juste équilibre.

12:34C'est pour ça qu'il y a besoin d'un rapport

12:36qui explique et qui interprète la loi.

12:38Il faut dire que le deuxième champion de LLM,

12:41vient de déclarer il y a une dizaine de jours

12:43à l'alpha l'allemand,

12:45deuxième parce que mon coeur est français,

12:47qui dit que ce n'est plus un business model

12:51de faire des LLM souverains.

12:53Et qui s'est retiré de la course.

12:55Donc il y a un vrai sujet sur la question

12:57des données et la qualité des données.

12:59On va arriver à notre deuxième sujet.

13:02Je voulais vous faire réagir en particulier, Jérôme.

13:05Est-ce que lancer une jeune pousse

13:07d'intelligence artificielle aujourd'hui

13:09c'est une mission impossible ?

13:13C'est difficile de répondre à cette question.

13:15Parce que c'est un papier dans La Presse,

13:18qui est un média canadien,

13:20qui apporte une réponse assez catégorique.

13:24Oui, c'est impossible.

13:26Avec des chiffres qui sont cités du patron d'Entropique.

13:29Les modèles apparus en 2024 ont coûté

13:31au bas mot 1 milliard de dollars.

13:33Ceux qu'on verra apparaître en 2025-2026

13:35coûteront 5 à 10 milliards.

13:37Pour une start-up qui se crée,

13:39c'est un peu compliqué d'avoir ces moyens de financement.

13:41Oui, on peut dire ça comme ça, c'est compliqué.

13:43Donc, impossible ?

13:44Oui, mais si on regarde par exemple,

13:46on a une aventure créée il y a deux mois,

13:48aux Etats-Unis, d'un modèle de super-intelligence,

13:51qui en plus arrive avec un positionnement un peu vertueux.

13:53Oui, on va en parler aussi.

13:54Exactement, on va en parler après.

13:55Et qui vient, après deux mois d'existence,

13:57de lever un milliard.

13:58Donc pour l'instant, j'allais dire,

14:00l'écosystème de financement autour de ces sujets

14:02a l'air de suivre l'inflation

14:04des investissements nécessaires.

14:06Pour l'instant, je ne sais pas vraiment

14:08si on a déjà touché la limite.

14:10Et je rajouterais en plus à ça,

14:11qu'il faut prendre conscience

14:13que dans ces énormes levées de fonds autour des modèles,

14:15il y a le problème des infrastructures GPU derrière,

14:17qui coûtent une fortune aujourd'hui

14:19du fait que le marché est très pénurique,

14:21avec peu d'acteurs, etc.

14:22Et que si jamais, d'aventure,

14:24on arrive avec moins de pénurie,

14:26on va avoir aussi des coûts d'infrastructures

14:28qui vont baisser,

14:29donc peut-être des investissements moins lourds.

14:31Et puis peut-être qu'un de ces cas,

14:32on va se rappeler aussi

14:33qu'on a une problématique peut-être écologique derrière,

14:35et qu'on est en train de créer des monstres énergivores,

14:37et que peut-être que si un jour,

14:39on commence à faire un virage

14:40vers des modèles un peu plus raisonnables

14:42en termes de consommation,

14:43là aussi on pourrait avoir une baisse d'investissement.

14:45Donc je trouve que c'est un peu tôt aujourd'hui

14:47pour tirer des conclusions aussi catégoriques.

14:49On ne baisse pas les bras tout de suite.

14:51Pour être compétitif,

14:53le seul choix c'est s'adosser

14:55aux géants existants, vous dites ?

14:57Pas forcément.

14:58Alors si, ça par contre je dis tout à fait forcément,

15:00mais ce n'est pas du tout une question de moyens.

15:01C'est qu'aujourd'hui,

15:02et c'est ce qu'a fait Mistral

15:03en commençant à travailler avec Microsoft,

15:04c'est que quand vous êtes un modèle,

15:05quel que soit le pays dans lequel vous êtes,

15:07de toute façon à un moment donné,

15:08vous avez le problématique d'infrastructure.

15:09Il vous faut des infrastructures mondiales

15:11et capables de passer à l'échelle mondiale

15:13pour accompagner les besoins de vos clients.

15:15Aujourd'hui, à part les trois hyper-scaleurs américains,

15:17qui est capable de faire ça ?

15:18Personne.

15:19Donc en fait, ils sont effectivement une porte d'entrée

15:21vraiment au sens du texte européen.

15:24On sait ce que c'est,

15:25une fois qu'on est marié,

15:26c'est compliqué de se séparer dans le numérique.

15:28Ah oui, ça je confirme.

15:29Et donc effectivement,

15:30il y a ce risque d'avoir ce phénomène de phagocytage

15:32de toute innovation,

15:33parce qu'à un moment donné,

15:34s'il faut passer par eux,

15:35sinon vous ne pourrez pas toucher

15:36et servir l'ensemble de vos clients.

15:38Allez, on va regarder ces nouveaux modèles d'IA,

15:40parce que le temps passe très vite.

15:42Vous l'avez évoqué,

15:43SAFE, Super Intelligence,

15:45qui a levé un milliard de dollars pour son IA.

15:47Sûr.

15:48Alors, on va en parler.

15:49Qu'est-ce que c'est une IA sûre ?

15:51En tout cas, d'abord,

15:52l'information notable,

15:54c'est que cette start-up SSI

15:56a été co-fondée notamment par Iliad,

15:59qui dirigeait l'équipe de super alignement

16:02chez OpenAI

16:04et qui a participé au départ de Sam Altman,

16:09au départ avant qu'il revienne, bien sûr.

16:11Il lui prend le parti, en fait,

16:12de ne pas commercialiser de produits

16:14avant d'avoir la certitude

16:15que ces systèmes d'IA

16:16ne représentent aucun danger pour l'humanité.

16:19On est capable de s'assurer de ça aujourd'hui.

16:22Comment on fait ?

16:23Muriel.

16:24Moi, je pense que si la safety,

16:27comprise à l'américaine,

16:29qui est en fait une façon d'appeler la gouvernance,

16:32de ces modèles passe par

16:34défier le paradigme de la boîte noire,

16:37je pense qu'on arrivera à quelque chose

16:39qui peut être gouvernable.

16:42Je ne reprends pas la vulgate californienne

16:45de l'alignement

16:46parce que je pense que le vrai problème,

16:47c'est d'avoir de l'observabilité.

16:49Par exemple,

16:53Anthropique a dévoilé au mois de mai

16:55une étude qui montre

16:56combien ils arrivent tout doucement

16:58à l'intérieur d'un modèle de langage

17:00qui est en production,

17:01de 70 milliards de paramètres,

17:03à commencer à comprendre

17:05comment l'information est condensée

17:07dans le réseau de neurones.

17:08Et ça, c'est essentiel, en fait,

17:09de gagner cette observabilité

17:11pour pouvoir gouverner les sorties,

17:12gouverner les hallucinations,

17:14gouverner toutes sortes de problématiques

17:16qui, après, se retrouvent

17:18dans la difficulté d'adoption

17:20des outils d'IA génératives.

17:22Donc, je pense qu'aujourd'hui...

17:23On a vu comment ça fonctionne

17:24quand on entraîne

17:25une intelligence artificielle

17:27et qu'on s'aperçoit qu'elle donne

17:29d'excellents résultats dans certains cas

17:31et vraiment des absurdités dans d'autres.

17:34On pratique de la correction,

17:35mais on ne sait pas pourquoi,

17:37d'un seul coup,

17:38cette IA se met à être stupide

17:39ou super intelligente.

17:41C'est ça ?

17:42Oui, on commence à avoir des hypothèses

17:44de trous dans les données,

17:46de problématiques de représentativité

17:48des données,

17:49mais sur le fond,

17:50on reste dans une situation

17:51où, à l'intérieur du réseau de neurones,

17:53la façon dont l'information

17:55passe d'une strata à une autre

17:57est compliquée,

17:58surtout quand on a des modèles

17:59très, très grands.

18:00Donc, ça a été un proof-of-concept

18:02au printemps,

18:03comme vous disiez,

18:04de commencer à comprendre

18:06quels sont les motifs

18:09d'activation des neurones

18:11par l'équipe de l'entropique.

18:14Parce que, juridiquement,

18:17on exige une certaine transparence

18:19aujourd'hui de la part des algorithmes,

18:20et donc là, techniquement,

18:22c'est impossible,

18:23puisque même les fondateurs

18:26sont face à une boîte noire.

18:28Oui, en droit des données,

18:30on fait plus attention

18:31à l'effet sur les personnes.

18:32Est-ce que ça va avoir un effet négatif

18:34sur leur droit ou sur leur vie, etc. ?

18:36Et, dans ces cas-là,

18:37plutôt qu'être capable de l'expliquer,

18:39il faut aussi être capable

18:40de le rectifier.

18:41C'est ça le plus important.

18:42Mais c'est vrai que,

18:43dans un certain niveau de sophistication,

18:45comme ça vient d'être expliqué,

18:46on n'est pas vraiment capable.

18:47C'est la boîte noire.

18:48Donc, on va se concentrer

18:49sur les effets, les prévenir,

18:51essayer d'avoir des mesures

18:52de gouvernance, justement,

18:53pour les limiter a priori

18:55et les remédier a posteriori.

18:57Mais c'est des systèmes

18:59qui sont encore en phase

19:03d'expérimentation, parfois.

19:04Et donc, les décisions automatisées,

19:06on les a depuis longtemps

19:07dans le monde du droit des données,

19:08le profil bancaire, le scoring, etc.

19:11C'est ancien.

19:12Mais là, ça prend des proportions

19:13qui peuvent être plus importantes.

19:15Et donc, c'est d'autant plus difficile.

19:18Et puis, juste,

19:19il y a les fournisseurs de modèles,

19:20bien sûr.

19:21On pense toujours à eux.

19:22Et on en parle beaucoup.

19:23Mais il n'y a pas qu'eux

19:24dans la chaîne de l'intelligence artificielle.

19:25Il y a d'autres rubriques.

19:26On parle des vectors stores,

19:28des rags, etc.

19:29Et c'est tout l'ensemble

19:30de cette combinatoire

19:31qui va créer ou pas une efficience

19:32ou éventuellement une infraction

19:33à certaines réglementations.

19:35Et donc, là aussi,

19:36on va avoir des chaînes

19:37de responsabilité un peu complexes.

19:38Et en tout cas, du coup,

19:39même effectivement

19:40pour les éditeurs de modèles,

19:41d'arriver à trouver l'origine

19:42à un moment donné d'une erreur

19:44ou d'une hallucination,

19:45c'est...

19:46Alors, ça semble plus simple

19:47pour les modèles fine-tunés,

19:48enfin, en tout cas personnalisés

19:49puisqu'ils sont alimentés

19:50uniquement de données

19:51décidées de commun accord

19:52autour d'une problématique

19:53d'une entreprise.

19:54Oui, mais attention

19:55parce que vous-même,

19:56en tant qu'entreprise,

19:57par exemple,

19:58quand vous allez vous la utiliser,

19:59vous allez charger

20:00votre propre contexte de données avec.

20:01Donc, dans quelle mesure

20:02c'est vous-même

20:03qui avez créé, en fait,

20:04l'hallucination,

20:05l'erreur ou l'infraction

20:06alors que...

20:07Enfin, on est sur des chaînes.

20:08Aujourd'hui,

20:09on apprend en marchant.

20:10Oui.

20:11Muriel.

20:12La Silicon Valley

20:13a quand même compris

20:14le problème aussi,

20:15déjà depuis un an,

20:16en investissant

20:17de façon de plus en plus importante

20:18au niveau du venture capital

20:19dans une strata d'observabilité.

20:20C'est-à-dire que vous avez

20:21votre banque de données vectorielle

20:22qui est branchée

20:23à votre modèle de langage

20:24pour sécuriser

20:25que les données

20:26qui sont utilisées

20:27pour les réponses

20:28sont bien les données

20:29de votre entreprise

20:30ou les données

20:31que vous retenez,

20:32les bonnes données

20:33pour répondre à vos clients

20:34ou à vos employés

20:35si vous l'utilisez

20:36pour le management

20:37de connaissances.

20:38C'est-à-dire que vous avez

20:39votre banque de données

20:40que vous l'utilisez

20:41pour le management

20:42de connaissances.

20:43Mais ajouter cette strata

20:44permet de contrôler

20:45ce qui ressort

20:46de l'application

20:47basée sur la générative.

20:48Cette strata d'observabilité

20:49est une très bonne nouvelle

20:50pour la gouvernance

20:51et la sophistication

20:52des métriques

20:53qui sont utilisées

20:54à ce niveau-là

20:55est une très bonne nouvelle

20:56pour les entreprises

20:57et pour la gouvernance

20:58parce qu'ils vont pouvoir

20:59savoir jusqu'à quel point

21:00le modèle répond bien

21:01ou mal

21:02à leurs consommateurs.

21:03Et ça, ça fonctionne.

21:04Et ça, ça fonctionne.

21:05On va passer

21:06à cette nouvelle IA

21:07O1

21:08d'OpenAI.

21:09Donc nouvelle série

21:10de modèles

21:11d'intelligence artificielle

21:12qui sont vraiment conçus

21:13pour résoudre

21:14des problèmes complexes.

21:15On parle de problèmes

21:16scientifiques

21:17en physique,

21:18chimie, biologie

21:19avec des résultats

21:20qui seraient similaires

21:21à ceux des doctorants.

21:22Il semblerait

21:23que OpenAI découvre

21:24que ces modèles

21:25sont aussi super bons

21:26en physique,

21:27chimie, biologie

21:28avec des résultats

21:29qui seraient similaires

21:30à ceux des doctorants.

21:31Il semblerait

21:32qu'OpenAI découvre

21:33que ces modèles

21:34sont aussi super bons

21:35en maths et en programmation.

21:36Moi, ça me fait toujours

21:37quelque chose

21:38quand je comprends

21:39qu'en fait

21:40un créateur de modèles

21:41découvre quelque chose

21:42qu'il n'avait pas prévu.

21:43Bon.

21:44Est-ce qu'on est là

21:45vraiment vers

21:46la super intelligence

21:47que tout le monde promet

21:48pour les années qui viennent ?

21:49Je vais laisser la chercheuse.

21:50Alors, on est vraiment

21:51pas sûr de la super intelligence.

21:52On est vraiment pas sûr

21:53de la super intelligence.

21:54C'est vrai.

21:55C'est vrai.

21:56C'est vrai.

21:57C'est vrai.

21:58C'est vrai.

21:59C'est vrai.

22:00C'est vrai.

22:01C'est vrai.

22:02C'est vrai.

22:03C'est vrai.

22:04C'est vrai.

22:05C'est vrai.

22:06C'est vrai.

22:07C'est vrai.

22:08C'est vrai.

22:09J'ai parlé de la super intelligence.

22:10Ce qui est intéressant par contre,

22:11c'est qu'ils insèrent

22:12tout plein d'étapes

22:13qui permettent à l'utilisateur

22:14de se rendre compte

22:15comment on pourrait

22:16décomposer sa question

22:17de façon assez redondante.

22:18Plus on en fait,

22:19plus on rend compte

22:20que les étapes sont un peu

22:215-6 étapes maximum

22:22et puis ça reboucle.

22:23Donc, je pense que c'est

22:24une façon d'explorer

22:25un peu les possibles.

22:26Mais on est toujours

22:27avec dans cette interface

22:28où il y a écrit

22:29« thought for 11 seconds ».

22:30Ça a pensé pendant 11 secondes.

22:34On est toujours dans cette commercialisation de l'anthropomorphisation qui est très accentuée.

22:39Ce qui est assez fascinant, c'est que ça montre que les entreprises les plus innovantes,

22:44qui sont quelques-unes leaders mondiales, sont engagées dans une course à l'innovation.

22:48Non seulement elles sont leaders, mais c'est la condition de leur survie sur le marché.

22:53Je suis très impressionné par la vitesse de lancement des nouveaux produits.

22:56On n'a pas eu le temps de parler de Mistral AI, notre français bien.

23:01Avec son premier LLM multimodal, Mistral 12B.

23:04Merci beaucoup. Merci Jérôme Vallat de Clérope, Muriel Popafab d'Experts au Conseil de l'Europe

23:10et Yann Padova de Wilson Sans Souci. Merci.

23:20On termine cette édition avec le regard sur le business mobile de Jérôme Bouteiller.

23:24Bonjour Jérôme. Bonjour.

23:26Fondateur d'EcranMobile.fr. Vous allez nous parler de Distraction Control.

23:31Je ne suis pas sûr que tout le monde en ait entendu parler.

23:33Justement, c'est intéressant. C'est une nouvelle fonctionnalité qu'on va pouvoir retrouver dans l'iPhone

23:37et qui peut bloquer les publicités.

23:40Effectivement, cinq ans après l'introduction d'ITP qui compliquait la collecte de cookies sur Safari,

23:46trois ans après ATT qui a imposé une seconde pop-up de consentement,

23:50Apple a décidé de mettre à nouveau le bazar dans le monde de la publicité et des médias

23:55en introduisant une nouvelle technologie baptisée Distraction Control.

23:58C'est lancé cette semaine avec iOS 18 et c'est intégré à Safari, le navigateur web de l'iPhone.

24:05Ça va permettre aux mobinaux de masquer des éléments d'une page web qui pourraient les déconcentrer.

24:11Concrètement, on va pouvoir masquer une publicité, des liens sponsorisés à l'interstitial d'une vidéo

24:17et même les fameuses boîtes de consentement pour recevoir des notifications ou pour la collecte des cookies.

24:22Je crois que ça va faire plaisir aux utilisateurs. Pas sûr, en revanche, que ça n'inquiète pas les médias.

24:27Oui, effectivement, les médias digitaux sont très inquiets car ils redoutent à juste titre que le blocage des CMP,

24:33ces fenêtres de consentement paradoxalement devenues aussi intrusives que des publicités,

24:38que ce blocage leur complique la vie pour valoriser leurs inventaires.

24:43Distraction contrôle pourrait aussi bloquer l'affichage des publicités qui est la principale source de revenus des médias en ligne.

24:51C'est évidemment une mauvaise nouvelle pour beaucoup de titres qui avaient décidé de prendre le virage de la publicité 100% digitale et d'abandonner le papier.

24:58Le président d'Alliance Digitale, Nicolas Riel, estime ainsi que permettre aux internautes d'accéder à du contenu sans partager leurs données ou payer, c'est se rendre complice de vol.

25:07C'est comme si Apple leur donnait un moyen d'enlever le tourniquet des métros pour passer sans payer.

25:13Et quel pourrait être l'impact pour les médias ?

25:16Il faut d'abord rappeler que cette fonctionnalité va se limiter aux appareils Apple qui, malgré le succès de l'iPhone, n'ont qu'environ 30% de parts de marché en France.

25:25Le second point, c'est que c'est une fonctionnalité qui se limite à Safari, le navigateur web des appareils Apple, et donc ça ne touchera pas l'univers des applications.

25:34Et selon une récente étude de la CPM, le web mobile représente tout de même encore 65% de l'audience des médias digitaux.

25:41Et donc si distraction contrôle se généralisait, ce serait donc potentiellement 20 à 25% de l'audience de la presse en ligne qui pourrait être privée de publicité ou de collecte de données.

25:50Avant l'été, des associations professionnelles comme le GES, le SRI ou Alliance Digitale avaient envoyé une lettre ouverte à Tim Cook, le patron d'Apple,

25:58pour lui expliquer que c'était une innovation qui allait à l'encontre de leur modèle économique et que ça pouvait aussi aller à l'encontre des recommandations du RGPD.

26:06Ce qui n'a pas suscité de réaction d'Apple, pourtant très sensible à ces questions de vie privée.

26:10Mais pourquoi cela pourrait aller à l'encontre du RGPD ?

26:13Depuis sa mise en place en 2018, le règlement général pour la protection des données, qui est un texte européen, impose un cadre très strict pour la collecte et l'exploitation des données personnelles.

26:23Et dans le domaine publicitaire, c'est le consentement qui est le modèle qui s'est imposé, qui permet de déposer des cookies et qui va permettre de mieux cibler les internautes,

26:31mais également de mesurer la pression publicitaire ou tout simplement de mesurer les audiences.

26:35Et si distraction contrôle ne permet pas d'afficher les bandes aux cookies, les médias ne sauront plus s'ils peuvent collecter des données personnelles.

26:42Et ça va évidemment les gêner dans la monétisation de leur site web.

26:45Qu'est-ce qui va se passer selon vous ?

26:47À court terme, pas grand chose. Les médias vont subir cette innovation et les internautes pourront consulter gratuitement un site web sans avoir accepté les cookies, sans même voir de publicité.

26:58Mais à moyen terme, on peut redouter des dispositifs techniques qui bloqueraient les bloqueurs de pub.

27:04Et il est donc probable qu'il y ait des messages d'avertissement qui s'affichent avant même les cookie wall et donc qui limitent la navigation.

27:11Et puis il y aura sans doute aussi un volet judiciaire avec une réponse dans les tribunaux, avec le constat d'une distorsion de concurrence entre les médias indépendants et le média Apple.

27:21Oui, parce que le modèle économique d'Apple repose aussi en partie sur la pub.

27:26Oui, on le sait peu, mais Apple est devenu en quelques années un géant de la publicité.

27:30Il y a d'abord une commission sur les liens sponsorisés qui s'affiche justement dans le navigateur web.

27:35Et avec un partage de ruines avec Google, on parle de recettes annuelles estimées à 20 milliards de dollars.

27:40C'est gigantesque.

27:41Et puis après un faux départ il y a une dizaine d'années, Apple a aussi relancé sa régie Search Ads dans l'Apple App Store.

27:48Et là, on est aussi sur des volumes financiers de l'ordre de 10 milliards de dollars supplémentaires.

27:53Donc avec 30 milliards, Apple est un géant de la publicité digitale.

27:56On n'est pas encore au niveau d'un Google qui fait 250 milliards ou d'un Meta qui fait 120 milliards.

28:01Mais c'est un géant de la publicité digitale et toute action qui irait à l'encontre des médias indépendants

28:06pourrait être très mal vue par les autorités antitrust de part et d'autre de l'Atlantique.

28:10Merci beaucoup Jérôme Bouteiller d'EcranMobile.fr de nous avoir éclairé sur cette nouvelle fonctionnalité qui arrive cette semaine.

28:18Merci à vous tous de nous suivre avec régularité sur la chaîne BeSmart for Change,

28:23également en replay et en podcast.

28:25Je vous dis à très bientôt pour de nouvelles discussions sur la tech.

28:31– Sous-titrage Société Radio-Canada

SMART TECH - Emission du mardi 24 septembre

Catégorie

Transcription

Recommandations