• avant-hier
Grok 3, l'IA de X vient de sortir. On décrypte.

Catégorie

🤖
Technologie
Transcription
00:00Elon Musk nous avait teasé sur l'arrivée de l'IA la plus intelligente au monde, et bien c'est le cas avec
00:05Grog 3, le dernier modèle de XAI.
00:10Alors oui, sur les benchmarks présentés par les équipes de XAI, Grog 3 apparaît comme l'IA la plus performante du moment.
00:18Et si la plupart des benchmarks présentés ont été édités par les équipes de XAI,
00:22il y a un benchmark qui attire plus mon attention, le classement de Chatbot Arena.
00:27Sur ce classement, Grog 3 arrive en première position avec un score ELO de 1400.
00:32Chatbot Arena, c'est une plateforme d'évaluation indépendante,
00:36et un classement qui a pour particularité de se reposer sur les avis d'utilisateurs réels
00:41qui ont testé les différents modèles d'IA à l'aveugle.
00:44Donc un classement très flatteur pour les équipes de XAI et pour Grog 3.
00:50Dans la présentation de ce nouveau modèle Grog 3,
00:53on a eu le droit à la mise en avant d'un facteur clé de succès qui est très intéressant à comprendre.
00:59La première version de Grog date seulement de 17 mois,
01:03et le dernier modèle d'XAI rivalise maintenant avec des entreprises pionnières de l'IA,
01:07et notamment avec les modèles d'OpenAI.
01:09Derrière cette performance, la stratégie de XAI peut se résumer dans cette phrase.
01:18Une grande intelligence nécessite une grande puissance de calcul.
01:22La puissance de Grog 3 et le fait que ce modèle dépasse ses concurrents,
01:26ça a été possible grâce à la construction d'un énorme datacenter regroupant près de 100 000 GPUs,
01:34et qui a d'ailleurs été agrandi ensuite pour atteindre 200 000 GPUs.
01:39GPU c'est l'abbreviation de Graphic Processing Unit,
01:43en gros c'est les cartes graphiques pour booster la puissance de calcul.
01:46Dans le monde de l'IA, les performances d'un modèle dépendent de sa capacité et sa rapidité
01:51à emmagasiner et compresser les données avec lesquelles on l'entraîne.
01:55La clé c'est donc la puissance de calcul.
01:58D'où l'importance d'avoir un énorme datacenter,
02:00mais cette taille elle s'accompagne de défis technologiques.
02:03Déjà posséder un grand nombre de GPUs, ce qui représente déjà un énorme investissement.
02:08Ensuite il faut de l'énergie en très grande quantité,
02:10et il faut être capable de créer une infrastructure de refroidissement efficace
02:15pour éviter la surchauffe des serveurs.
02:17Sans aller dans les détails,
02:18c'est cet énorme datacenter qui a permis aux équipes d'XAI d'entraîner GROK 3,
02:23et de rendre le modèle dix fois plus puissant que son prédécesseur.
02:27D'ailleurs cet entraînement il continue, et GROK 3 progresse de jour en jour.
02:31En misant sur cet énorme datacenter, Elon Musk a gagné son pari,
02:36et a refait son retard dans la course à la meilleure IA.
02:38Mais la puissance d'un modèle n'est rien si son interface et ses fonctionnalités ne sont pas bien pensées.
02:46Les nouvelles fonctionnalités de GROK 3 sont articulées autour de la capacité à raisonner.
02:52Trois nouveautés sont mises en avant.
02:54La première fonctionnalité, Think, va inciter le modèle à procéder par étapes dans son raisonnement,
03:00lui permettant ainsi de mieux comprendre le problème,
03:03et donc de répondre malgré sa complexité.
03:05Ainsi dans l'exemple choisi, GROK 3 a été capable de coder une animation 3D,
03:11permettant de simuler le meilleur moment pour une navette SpaceX,
03:14de quitter la Terre en direction de Mars, et vice-versa.
03:17Et ça en fonction de l'orbite des deux planètes.
03:19Et le résultat est impressionnant.
03:21La deuxième fonctionnalité présentée, Big Brain, permet d'attribuer encore plus de puissance de calcul à l'IA,
03:27lui donnant ainsi la capacité de raisonner plus longtemps, de recalculer,
03:31de se corriger si nécessaire, pour un résultat optimal mais aussi très créatif.
03:36Dans l'exemple donné, GROK 3 était ainsi capable de coder un jeu,
03:40mélangeant deux jeux différents, Tetris et BJ World,
03:44et en demandant simplement à l'IA de se débrouiller seul pour faire preuve de créativité,
03:48et créer le jeu le plus fun possible.
03:51Là encore, le résultat obtenu est plutôt concluant,
03:53surtout en sachant qu'on est parti d'un prompt ultra vague et sans réel consigne.
03:58Enfin, la dernière fonctionnalité mise en avant est l'option Deep Search,
04:02une fonctionnalité permettant de demander à l'IA d'effectuer des recherches sur un sujet,
04:07en multipliant les sources, notamment à l'aide d'Internet.
04:10L'IA va donc naviguer sur différents sites web, regrouper les informations, les synthétiser,
04:15et sera capable de s'autocorriger et de faire preuve de critique pour proposer le résultat le plus précis.
04:20On peut d'ailleurs voir via l'interface la progression de l'IA dans ses recherches,
04:24et les actions qui lui permettent de construire sa réponse.
04:27Une nouveauté qui rappelle pas mal la dernière fonctionnalité présentée par OpenAI,
04:31et qui avait d'ailleurs un nom assez similaire, Deep Research.
04:34En exemple, amusant, les équipes de XAI ont demandé la prédiction des résultats
04:39pour l'ensemble des matchs du March Madness, un championnat de basketball universitaire organisé en mars.
04:46Curieux de voir si les prédictions de GROK 3 seront exactes,
04:49GROK 3 a annoncé la victoire des Hobion Tigers, à suivre donc.
04:53Bien sûr, GROK 3 arrive avec toutes les fonctionnalités déjà disponibles sur GROK 2.
04:57On aura donc toujours la génération d'images et les fonctionnalités multimodales.
05:01Si GROK 3 n'est pour l'instant disponible que pour les abonnés premium,
05:05la version 2 de GROK est disponible en accès gratuit,
05:08il te suffira pour ça de te connecter à un compte utilisateur X.com,
05:12tu auras alors accès à GROK 2.
05:14Une des particularités de cette IA, c'est le fait qu'elle est beaucoup moins censurée que les autres.
05:19Une censure moins forte qui permet par exemple de créer des images IA avec des célébrités et personnalités publiques.
05:25Et d'ailleurs, GROK a beaucoup été critiqué sur ce fait,
05:28car l'IA est accusée d'être un générateur de fake news en puissance.
05:32Il faut noter tout de même que depuis les premières versions de GROK,
05:36XAI a significativement augmenté le niveau de censure sur son générateur d'images.
05:41Il reste quand même beaucoup plus permissif que ses concurrents comme DALI ou MIDJOURNEY,
05:45notamment sur la représentation de personnalités connues du grand public.
05:49On verra à l'avenir si la censure va se renforcer sur GROK,
05:53et d'ailleurs au passage, si tu te poses la question,
05:55GROK connaît également les personnalités françaises,
05:58ça peut paraître rigolo comme ça,
06:00mais il est important de sensibiliser sur ce point,
06:02en espérant qu'avec la démocratisation de l'IA,
06:05de plus en plus de personnes sauront faire la part des choses,
06:08et ne tomberont pas dans ces pièges grossiers.
06:10GROK 3 sera d'abord réservé aux abonnés premium de X,
06:14et accessible un jour pour tout le monde,
06:16mais là, on n'a pas de date annoncée.
06:18Les dernières fonctionnalités de GROK 3 sont actuellement en cours de déploiement pour les abonnés premium.
06:22Une nouvelle offre, SUPERGROK,
06:24permettra également d'accéder à ces fonctionnalités sans un abonnement X premium.
06:30Ce type d'abonnement ne sera disponible que sur la version web de GROK,
06:33et via l'application GROK.
06:35Au passage, l'application mobile sortira d'ici la fin du mois en France,
06:39sur l'App Store, c'est annoncé pour le 28 février 2025.
06:43Et bonne nouvelle, GROK 2 lui sera disponible bientôt en open source,
06:47d'après Elon Musk, c'est une question de mois,
06:50une fois en fait que GROK 3 sera stabilisé.
06:52L'accès en API arrive lui aussi bientôt,
06:55sans qu'on ait pour l'instant une idée des tarifs.
06:57Enfin, les équipes de XAI nous ont aussi teasé l'arrivée d'un mode conversationnel,
07:02et j'ai même l'impression qu'il sera possible d'utiliser la voix d'Elon Musk avec ce mode vocal.
07:15Avec ces annonces et son nouveau modèle,
07:17les équipes de XAI semblent s'imposer pour de bon dans le paysage de l'IA.
07:22Il faut suivre maintenant si les différents déploiements seront bien orchestrés,
07:26et si les utilisateurs répondront présents.
07:29Car si on met de côté les enthousiastes de l'IA,
07:31c'est toujours compliqué de convaincre un utilisateur ayant pour habitude d'utiliser
07:35Chajepeté, Gemini, Cloud ou Mistral, de changer pour une nouvelle plateforme.
07:39Pour cette raison, les benchmarks n'ont au final pas forcément beaucoup d'importance.
07:44Quand il s'agit d'adoption de masse, les leviers sont sûrement ailleurs.
07:47Et pour XAI, l'intégration de GROK à X.com est sûrement un de ses leviers les plus puissants.
07:53S'il y a les réseaux sociaux et la création de contenus d'intérêt,
07:56je t'encourage à t'abonner à notre newsletter, le lien est en description et en commentaire épinglé.
08:00C'était Boris, merci et à bientôt sur le Labo des réseaux.

Recommandations