Jeudi 13 avril 2023, SMART TECH reçoit Laurent Daudet (Directeur Général cofondateur, LightOn)
Category
🗞
NewsTranscription
00:00 [Musique]
00:06 Sur le plateau de Smartech aujourd'hui, mes commentateurs Marie-Christine Levet, fondatrice d'Educapital,
00:12 Alain Staron, président d'Artifil et Yann Lechel, entrepreneur, PDG de Sens Digital.
00:16 Bienvenue à tous les trois.
00:18 On va débriefer ensemble de l'actualité de la semaine, de ces jours-ci, et puis aussi de notre premier sujet.
00:25 On est très honoré de recevoir Lighton en plateau.
00:28 Bonjour Laurent Daudet, vous êtes à la tête de cette startup dont tout le monde me parle.
00:32 J'ai reçu hier le coordonnateur de la stratégie nationale pour l'intelligence artificielle,
00:38 qui m'a parlé de Lighton.
00:39 J'ai reçu le Hub France IA lundi, qui a publié sa cartographie des startups de l'IA,
00:44 qui m'a parlé également de votre startup.
00:47 Vous êtes notre futur champion, paraît-il, dans ces intelligences artificielles génératives
00:52 qui font beaucoup parler d'elles.
00:54 Au départ, Lighton, c'est une spin-off d'universitaires.
00:59 Je voulais vous faire réagir là-dessus aussi.
01:01 C'est Guillaume Averin, hier, dans sa grande interview, qui nous disait
01:05 « C'est vrai qu'on a les technos, on a les talents, on a vraiment tout ce qu'il faut pour réussir,
01:10 mais je vous ai remarqué qu'il nous manquait quand même les champions économiques. »
01:14 Et là-dessus, il me dit « C'est vrai qu'il faut aussi qu'on apprenne à penser pas seulement offre,
01:19 c'est-à-dire prouesse technologique, mais aussi demande. »
01:22 Ça vous parle, ça ?
01:23 Oui, tout à fait.
01:24 Je pense qu'on arrive à un moment de l'histoire où l'IA n'est plus juste une question d'ingénieur.
01:30 On est vraiment à un moment très singulier.
01:32 Et maintenant, cette IA, elle est prise en main par des gens dans les entreprises,
01:38 dans des business units très différents, des gens du marketing, des gens du service de R&D,
01:42 des gens en production, etc., en service client.
01:47 Tout un ensemble d'activités qui autrefois ne prenaient pas en main ça.
01:52 Et maintenant, ça passe en production.
01:54 On n'est plus à l'étape de la découverte, on est vraiment à l'étape de mise en production économique.
01:58 Ça veut dire aussi que c'est une nouvelle façon de penser son entreprise.
02:02 Les deep tech jusqu'ici travaillaient quand même sur de la recherche et développement,
02:07 pas forcément en s'intéressant derrière ou à la demande du marché.
02:12 Ça tente, aux usages, aux nouveaux usages.
02:14 Oui, vous avez raison.
02:15 Et ces IA permettent de valoriser ces données, de faire des gains de productivité extrêmement importants.
02:23 Parfois, on peut diviser par 10 le temps passé sur une tâche donnée.
02:28 On peut vraiment le penser en termes de facteurs de gains de productivité pour l'entreprise, maintenant, aujourd'hui.
02:35 Quand je vous ai reçu, il y a un an, en plateau dans Smartech,
02:40 on parlait de repousser les limites de l'intelligence artificielle.
02:44 Depuis, il y a eu la sortie de ChatGPT par OpenAI, qui a surpris tout le monde, je crois.
02:50 Et vous avez vous-même opéré un virage, en 2020, vers ces IA Générative.
02:57 Vous pensiez que ça allait rencontrer un tel succès ?
03:00 Oui, pour nous, effectivement, c'était mai 2020, quand OpenAI a sorti l'ancêtre de ChatGPT, c'était GPT 3.
03:06 Et pour nous, c'est là où on a eu cette révélation, où on s'est dit, le futur de l'IA, c'est ça.
03:10 D'abord, d'un point de vue technique, ça nous a absolument scotché, ce truc où on scale des modèles,
03:15 on fait des modèles à 175 milliards de paramètres, et là, on voit arriver des propriétés émergentes,
03:20 ce qu'on appelle le "Zero-Shot Learning". En gros, ça sait faire des tâches sur lesquelles ça n'a pas été explicitement entraîné.
03:25 Donc, d'un point de vue des gens qui sont des chercheurs sur l'IA, c'est absolument nouveau.
03:30 Mais après, on a vu aussi le potentiel économique de ça.
03:34 On s'est dit, ça va changer la façon dont les gens interagissent avec le texte,
03:38 et ça a révolutionné le tertiaire, en quelque sorte.
03:41 Donc, votre plateforme, l'équivalent de ChatGPT, notre futur champion mondial,
03:45 on va même l'appeler comme ça, s'appelle Paradigm.
03:48 Est-ce que ça fait exactement la même chose que ce qu'on a pu nous expérimenter avec ChatGPT ?
03:53 Alors, c'est très similaire d'un point de vue cœur technique.
03:57 Par contre, on est très différent d'un point de vue modèle de distribution.
04:00 On va s'installer sur les serveurs des entreprises directement, "on-premise", comme on dit,
04:04 ce qui fait qu'il n'y a aucun problème de confidentialité des données.
04:07 Je ne sais pas si vous avez entendu parler la semaine dernière de Samsung,
04:10 qui s'est rendu compte qu'il y a eu plein de ces données qui sont parties dans la nature
04:13 parce que ses employés utilisaient ChatGPT, à l'insu probablement de Samsung.
04:18 Quand vous utilisez les modèles d'OpenAI, quand vous êtes sur des API sur leur serveur,
04:24 vous ne savez pas trop ce qui va advenir de vos données.
04:26 Elles sont même parfois réutilisées pour la prochaine génération de modèles.
04:29 Alors, au contraire, nous, ce qu'on propose, c'est tout un environnement logiciel
04:32 où vous contrôlez totalement qui a accès à vos modèles, ce qu'ils en font,
04:36 quelle prompt ils utilisent, c'est-à-dire comment ils interagissent avec le modèle,
04:40 de façon à ce que vous puissiez après améliorer le modèle.
04:43 Donc, ça ne parle pas sur des serveurs cloud américains ?
04:45 Non, non, ça tourne sur les serveurs de l'entreprise, de nos clients.
04:49 Donc, modèle différent sur la confidentialité, mais sinon, en termes de fonctionnement, d'utilisation, c'est la même chose ?
04:57 Sinon, ça fait exactement le même type de fonctionnalité.
05:01 Vous pouvez faire des résumés, vous pouvez demander à faire des systèmes de questions-réponses, par exemple, sur des documents.
05:08 Vous pouvez faire des systèmes de générer des outils pour le marketing, vous pouvez analyser des avis clients,
05:18 vous pouvez faire tout ce qu'on peut faire avec les modèles ChargeAPD.
05:21 Ce sont des modèles de langage uniquement, ou vous travaillez aussi sur l'image ?
05:26 Non, non, on se concentre sur les modèles de langage, ce qui est déjà extrêmement complexe.
05:30 De toute façon, le langage, c'est l'épine dorsale de tous ces très grands modèles.
05:38 L'image est une extension, mais ça repose avant tout, ces modèles ont une vision du monde, si on peut dire, dues aux modèles de langage.
05:46 Et alors, comme vous êtes français, une entreprise française, est-ce que vos IA sont plus pertinentes dans notre langue ?
05:53 Déjà, effectivement, oui, il y a eu beaucoup de français dans le corpus d'apprentissage.
05:58 Les modèles qu'on propose parlent environ 10 langues, les 10 langues principales européennes.
06:04 Et on insiste beaucoup sur ces enjeux de souveraineté, effectivement.
06:08 Bien sûr, j'ai déjà parlé de la souveraineté des données, mais il est important qu'en Europe, il y ait des alternatives qui soient faites ici localement,
06:17 sur les langues européennes, qui comprennent peut-être mieux ce que c'est que la culture européenne, unies dans la diversité, comme dit la devise européenne.
06:26 Vous avez comparé, justement, les types de réponses qu'on peut avoir ? Est-ce qu'il y a...
06:30 Parce qu'on parle souvent de l'importance culturelle, en fait, que peut véhiculer un outil comme Tchad GPT.
06:38 Est-ce que vous avez pu constater qu'il y avait des réponses plus à l'américaine du côté de Tchad GPT que à l'européenne de votre pays ?
06:44 Ah oui, il y a eu un grand drame, là. Un jour, Tchad GPT... Alors, j'ai essayé il y a quelques mois, j'ai pas essayé la version la plus récente,
06:50 mais Tchad GPT m'a dit que le Mont-Saint-Michel était en Bretagne ! Quelle horreur !
06:54 Je vois qu'il n'est pas encore totalement acclimaté.
06:57 Bon, alors, sur l'actualité autour de ces modèles d'IA générative et de Tchad GPT en particulier,
07:03 on a l'ACNI, l'italienne, qui a vraiment précisé quelles étaient ses conditions pour lever les limitations d'utilisation des données des Italiens.
07:12 La deadline, c'est le 30 avril, ils ne rigolent pas, les Italiens.
07:15 Donc, il faut pouvoir s'opposer facilement à l'utilisation de ces données personnelles, interdiction d'utilisation aux mineurs,
07:21 faire aussi acte de pédagogie, vraiment, si je résume dans les grandes lignes.
07:26 Comment vous réagissez-vous à ce qu'impose aujourd'hui l'ACNI, l'italienne ?
07:31 Est-ce que vous pensez que ça peut déboucher sur des normes plus largement européennes ?
07:35 J'ai tendance à penser que cette nouvelle génération d'IA, effectivement, pose de nouvelles questions
07:41 par rapport aux régulations sur les données personnelles ou par rapport à tout ce qu'on peut faire en termes d'automatisation des processus.
07:49 On peut imaginer de l'IA qui va travailler sur des données médicales ou sur des CV en ressources humaines, etc.
07:55 Donc, c'est important qu'il y ait, effectivement, une réflexion sur ce qu'on doit faire avec les données personnelles,
08:00 ce qu'on doit faire avec ce type d'IA.
08:02 Ceci dit, il est vraiment important de réfléchir sur, de découpler le fond de la technologie et les usages qu'on en fait.
08:10 Parce que le risque, c'est quoi ? C'est de freiner, justement, la technologie en Europe ?
08:14 Exactement. Je pense qu'il est important que les régulateurs comprennent qu'il y a de l'innovation extrêmement pointue en Europe.
08:22 Il faut trouver le bon équilibre, je dirais, entre l'innovation et le besoin nécessaire de régulation sur le type d'usage qu'on peut faire,
08:32 qui peut être parfois... qui pose des questions, certainement.
08:35 En tout cas, Guillaume Averin, le coordonnateur de la stratégie nationale pour l'intelligence artificielle, dit
08:41 qu'on ne freine pas du tout sur les IA génératives, au contraire, on accélère en France.
08:46 Ce qui n'empêche pas de se poser des questions, quand même, sur les limites juridiques, les questions éthiques.
08:51 Vous avez une réaction là-dessus, sur la sortie de la CNIL italienne ?
08:54 Ou aussi, la plainte déposée par le député Eric Bottorell pour fausse information à son sujet ? Une plainte auprès de la CNIL ?
09:02 En Europe, c'est tout à fait légitime, en tout cas, de se poser des questions par rapport au framework, en tout cas au cadre RGPD.
09:10 Mais la solution viendra d'une entité comme Lighton, qui fournira un modèle "on premises", c'est-à-dire sur site,
09:16 qui répondra à la fois aux enjeux de souveraineté de la donnée, de la donnée personnelle, et qui rentrera dans les cadres.
09:23 Donc cette réflexion est tout à fait pertinente.
09:24 Mais ça veut dire qu'on n'ouvre pas au grand public aussi, parce que...
09:27 En fait, c'est ça, c'est-à-dire qu'on peut se dire "moi je suis plutôt pour freiner la régulation, pour justement encourager l'innovation, on vit tous dans le même bateau".
09:35 En l'occurrence, vu les drames rapides provoqués par le chat GPT...
09:39 Drame GPT, oui, bravo !
09:41 Je ne veux pas le dire.
09:43 Effectivement, il est important de s'y prendre à l'avance.
09:47 Et j'irai plus loin que le RGPD, parce que typiquement, vous répondez au RGPD à 100%.
09:52 Oui, oui.
09:53 Mais des sujets plus proches de l'éthique, qui est "est-ce que les messages délivrés sont pas susceptibles de manipuler à leur insu les utilisateurs, même si c'est dans un monde professionnel ?"
10:04 Ça c'est une question qui n'est pas traitée par le RGPD, et qui est posée par les IA Génératives.
10:08 Marie-Christine ?
10:09 Je dirais qu'on a tendance quand même en France à toujours trop réguler, et à un moment donné à laisser aussi les Américains avancer.
10:17 Et du coup, ne jamais s'avouer de champion français ou européen.
10:22 C'est clair qu'il faut mettre quelques règles, mais il ne faut vraiment pas freiner l'innovation.
10:27 Par exemple, interdire aux mineurs, je pense que c'est une bêtise, parce qu'ils iront le faire ailleurs.
10:33 Et au contraire, il vaudrait mieux les éduquer, leur apprendre à l'utiliser, etc. plutôt que d'être toujours en défensive.
10:39 Oui, on voit ce que ça a fait l'interdiction des réseaux sociaux aux mineurs.
10:43 Mais le moratoire qui a été signé par de nombreuses personnes, dont moi-même, a invité à ralentir la recherche sur des modèles supérieurs à RGPD 4.
10:52 Donc la France n'est pas dans la course aujourd'hui.
10:54 Enfin, je ne sais pas, on va poser la question à Layton !
10:57 Notre ambition est d'être dans la course, donc après l'histoire le dira.
11:01 Oui, bon. Il faut attendre combien de temps pour être vraiment dans la course ?
11:05 Ça peut aller vite ?
11:08 Ça va extrêmement vite, effectivement.
11:11 On est vraiment sur une accélération exponentielle du type d'investissement dans ce genre de technologies.
11:16 Dans le monde entier, chaque année, c'est multiplié par 10 peut-être, les montants qui sont mis, le nombre d'ingénieurs qui travaillent là-dessus.
11:25 Donc, effectivement, les constantes de temps, c'est à l'échelle de quelques mois. On ne parle pas à l'échelle de quelques années.
11:32 Merci beaucoup. C'est tout ce qu'on souhaite en tout cas.
11:35 Laurent Daudet, Layton, futur champion dans ces IA génératives.
11:40 À suivre tout de suite, c'est le reste du débrief de l'actu.