• l’année dernière

Category

🗞
News
Transcription
00:00 Bonjour et bienvenue dans cette nouvelle émission dans laquelle on va parler
00:14 intelligence artificielle et trading. Parce que ce que je trouve assez fascinant c'est
00:18 qu'on a l'impression aujourd'hui que l'intelligence artificielle peut tout faire. On nous montre des
00:23 intelligences artificielles qui peuvent peindre des tableaux, qui peuvent coder des jeux vidéo,
00:28 qui peuvent conduire une voiture, qui peuvent réussir les examens les plus difficiles. Et
00:33 pourtant on n'a toujours pas vu de gros fonds, de gros hedge funds qui arrivent à gagner énormément
00:40 d'argent basé sur l'intelligence artificielle. Moi je me serais attendu à voir émerger depuis je
00:45 sais pas deux, trois, quatre ans comme ça des fonds qui ont trouvé des stratégies basées sur
00:50 l'intelligence artificielle et qui cartonnent, qui ont des performances de 100% par an. Et pourtant
00:55 on n'a toujours rien et je trouve ça un petit peu bizarre donc je me suis pensé sur le sujet et on
00:59 va essayer de voir ça ensemble. Alors bien sûr il y a un fonds qui sort du lot qui lui a de
01:04 super performances avec des stratégies quantitatives, c'est le fonds Medallion de
01:08 Renaissance Technologies. Alors on sait pas réellement ce qu'ils font mais le fait qu'ils
01:13 aient des super performances depuis 1994 donc presque 30 ans prouve que même s'ils ont probablement
01:19 des modèles qui marchent sur du machine learning, ils sont probablement considérés comme basiques
01:24 aujourd'hui en tout cas, c'est sûr qu'ils n'ont pas du tout utilisé des modèles qui sont équivalents
01:29 avec les modèles d'intelligence artificielle aujourd'hui. Et la question c'est pourquoi est-ce
01:33 qu'on n'a pas des nouveaux fonds, une dizaine de nouveaux fonds basés sur l'intelligence
01:38 artificielle actuelle avec des performances similaires ? Parmi les raisons bien sûr la
01:44 première, celle auquel j'ai tout de suite pensé, c'est le fait qu'il y a une grande part de hasard
01:47 en bourse. En fait plutôt que de hasard on peut parler de bruit, de chaos etc. Et on connaît pas
01:53 la part du bruit dans les cours de bourse et la part du déterminisme, ce qu'on pourrait arriver à
01:59 prédire. Est-ce que c'est 80/20 ? Est-ce que c'est 99%/1% ? Est-ce que c'est 50/50 ? Ce qui est sûr
02:05 c'est que la valeur d'une entreprise ne varie pas de plusieurs pourcents tous les jours. Or c'est
02:10 ce qu'on constate tous les jours sur les marchés financiers. On peut donc imaginer que la plupart
02:14 des mouvements sont aléatoires, sont non prévisibles. Ce qui veut dire que même un modèle
02:19 d'intelligence artificielle qui serait totalement parfait, même ce modèle qui arriverait à prévoir
02:25 tout ce qui est prévisible, finalement il n'arriverait à prévoir que disons 20% des cours
02:29 de bourse. Et ça c'est vraiment la première chose qui pose problème à l'intelligence artificielle
02:35 en bourse, c'est toute cette partie en fait qui est floue, qui est basée sur le bruit. Et on voit
02:40 que l'intelligence artificielle elle est forte là où il n'y a pas de hasard, là où tout est déterminé
02:45 par exemple sur un score, un examen, surtout des examens de type QCM ou bien par exemple conduire
02:51 une voiture à chaque fois qu'il y a une bonne et une mauvaise réponse. Pour entraîner un modèle
02:56 d'intelligence artificielle, à une scène donnée il va y avoir une bonne réponse. À un feu rouge
03:01 on s'arrête, à un feu vert on démarre, sauf s'il y a une voiture devant soi. Si les voitures freinent
03:06 on va freiner aussi etc. C'est assez facile en fait dans une situation donnée de dire voilà la bonne
03:12 chose à faire et voilà la mauvaise chose à faire, ce qu'on n'arrive pas du tout à faire en bourse.
03:16 Le deuxième défi pour l'intelligence artificielle en trading c'est le manque de données. Parce qu'on
03:22 oublie souvent que derrière les performances d'un modèle comme GPT-3 ou GPT-4 il y a d'énormes
03:27 bases de données. Chaque GPT-3 utilise 175 milliards de paramètres. On parle pas de données,
03:33 de paramètres. Donc imaginez le nombre de données nécessaires pour avoir un modèle de 175 milliards
03:38 de paramètres. GPT quand on lui pose la question, GPT-4, quand on demande sur combien de données a
03:45 été entraîné GPT-3, il nous dit qu'il a été entraîné sur 45 teraoctets de données, soit
03:50 l'équivalent de plusieurs milliards de pages web. Et pour GPT-4 le nombre de paramètres n'est pas
03:55 divulgué mais on parle de 500 fois plus que GPT-3. Et ces modèles s'entraînent sur des années de
04:02 données, des décennies même de données, voire même des siècles de données, parce qu'ils
04:06 n'utilisent pas qu'internet. Ils ont aussi accès à tous les livres numérisés. Je pense qu'aujourd'hui
04:10 quasiment tous les livres, une grande partie des livres ont déjà été numérisés etc. Donc on voit
04:14 la somme de données est vraiment énorme. Alors que les modèles de trading, ils utilisent en
04:20 comparaison un nombre faible de données parce qu'on a les cours de bourse des différents actifs,
04:25 ok, mais ça on va l'avoir sur quelques années en fait d'historique parce qu'aujourd'hui si vous
04:31 achetez des données, vous allez avoir des données tick par tick, c'est-à-dire vraiment toutes les
04:34 transactions, idéalement tous les carnets d'ordre aussi, mais dès que vous allez remonter un petit
04:39 peu dans l'histoire, vous allez voir que vous allez trouver plus que des cours d'ouverture,
04:42 clôture et puis avec les plus hauts et les plus bas de la journée. Donc si vous voulez avoir un
04:47 historique un peu un peu costaud, vous allez voir que votre nombre de données disponibles
04:52 baisse énormément. Alors ensuite bien sûr il y a les données fondamentales, mais on a des données
04:57 qui sont uniquement trimestrielles sur les actions aujourd'hui, donc on va pas bien loin. Et puis
05:04 si vous regardez un bilan, un compte de résultats, un cash flow, la plupart de ces données ne sont
05:09 pas significatives et finalement pour une entreprise on va tomber sur quelques dizaines de données qui
05:15 vont être publiées tous les trimestres et qui vont être réellement importantes. Ensuite bien sûr vous
05:19 pouvez rajouter les données macroéconomiques, mais là à nouveau même si vous prenez tous les pays
05:23 du monde, on va avoir quelques centaines de données qui vont être publiées tous les mois,
05:27 vous pouvez prendre les discours des banques centrales, les discours des PDG etc. Mais on va
05:31 malgré tout ça rester sur un nombre limité de données, en tout cas un nombre limité de données
05:36 importantes par rapport aux IA généralistes comme Tchad GPT. Donc même si vous arrivez à créer un
05:42 super modèle d'IA, il aura été entraîné sur un nombre de données qui ne sera pas optimal et puis
05:47 vous allez rater quand même pas mal de données qui sont extérieures à ces données. Par exemple
05:51 sur Orpea, si un livre qui sort qui va dénoncer des scandales dans les Ehpad etc. ce ne sera pas
05:57 capté sur le Covid bien sûr, ça ne va pas être capté quand il commence à y avoir des problèmes
06:01 sur le marché immobilier, sur les crédits qui sont accordés qui ne sont pas d'assez bonne qualité.
06:05 Au départ ça ne se voit dans aucun chiffre, donc la crise des subprimes c'est pareil,
06:09 elle va passer sous le tapis et vous n'arriverez pas à l'anticiper. Après peut-être que le modèle
06:13 va bien réagir, mais sachant que c'était une crise d'une ampleur sans précédent, en tout cas dans ce
06:18 domaine là, à nouveau le modèle n'aura pas été entraîné sur un bon set de données. Et ça c'est
06:23 mon troisième point, c'est le fait que les IA, mais d'ailleurs comme la plupart des modèles
06:28 quantitatifs de trading sont entraînés sur des données du passé, donc à chaque fois qu'il y aura
06:32 quelque chose de nouveau, même si je parlais du Covid, même si vous prenez en compte les pandémies
06:37 etc, quand vous commencez à avoir des données d'infection qui commencent à arriver etc,
06:43 et qui vous permettraient peut-être d'avoir une réponse du marché financier, en fait ce qui s'est
06:49 passé pendant le Covid c'était du jamais vu. Donc même si vous avez le meilleur modèle d'intelligence
06:53 artificielle, même si vous y avez inclus des données par exemple d'infectiologie, peu importe,
06:59 vous n'allez pas avoir la bonne réponse, le modèle ne va pas réagir tout simplement parce qu'il n'aura
07:03 jamais été entraîné sur une pandémie de type Covid-19. Passons maintenant au quatrième point.
07:08 Admettons que le hasard ne joue pas une grande partie en bourse, donc je n'y crois pas,
07:14 mais on va se mettre dans ce scénario là, donc admettons qu'on peut réellement prévoir tous
07:18 les cours de bourse, première hypothèse. Deuxième hypothèse, admettons qu'on ait assez de données
07:22 pour entraîner le modèle, on arrive vraiment à tout chopper, des données tick-partic etc,
07:26 suffisamment loin dans le passé, toutes les données fondamentales et que ça suffise pour
07:29 créer un modèle avec suffisamment de paramètres qui nous permettent de tout prévoir. Ensuite
07:35 admettons le troisième point, admettons qu'on a entraîné sur des bases de données et que ce
07:40 qui se passe dans les prochains mois ou les prochaines années est déjà eu lieu dans le
07:43 passé, donc on n'a absolument rien de nouveau, le modèle ne découvre rien, il peut utiliser,
07:47 il arrive à trouver des bonnes prévisions à chaque fois puisqu'il n'y a rien de nouveau.
07:51 Donc on va prendre ces trois hypothèses là. Donc dans ce cas là on va avoir un problème qui va nous
07:55 détecter des anomalies de marché qui va pouvoir nous dire ce qu'il faut acheter ou ce qu'il faut
07:58 vendre. Mais reprenons nos exemples de ce qui est capable de faire une intelligence artificielle.
08:03 Je vous avais dit qu'il est capable, je sais pas, d'écrire une chanson, de créer une peinture etc
08:09 etc, ou de conduire une voiture par exemple. Le fait qu'il fasse dix belles peintures, elles
08:14 ne seront pas identiques ces peintures parce que chacun va demander quelque chose de différent,
08:18 et même en demandant la même chose le modèle va générer souvent des peintures différentes. Donc ça
08:23 ne pose pas réellement de problème que l'intelligence artificielle arrive à créer des dizaines, des
08:27 centaines ou des milliers de très belles peintures, ou bien fasse des très belles rédactions pour un
08:33 devoir d'histoire, de philo ou peu importe, ou bien qu'il conduise bien une voiture. Alors qu'en
08:39 trading c'est un petit peu différent parce que quand vous arrivez à détecter une anomalie,
08:43 quand vous voyez qu'il y a un problème quelque part sur le marché et que vous commencez à acheter
08:46 des actions ou à en vendre, ben petit à petit cette anomalie va se résorber. Et ça c'est ce
08:52 qu'on voit dans toute l'histoire de la bourse à l'époque de Benjamin Graham. Les entreprises par
08:57 exemple, leurs cours de bourse n'avaient rien à voir avec la valorisation de l'entreprise, personne
09:02 ne regardait les bilans, les comptes de résultats etc, il n'y avait pas d'analyste financier, en
09:05 tout cas très peu de personnes le faisaient, donc on pouvait détecter des anomalies et c'est là
09:10 que la stratégie value, la stratégie de Benjamin Graham a été créée. Aujourd'hui je ne dis pas
09:16 que les cours de bourse représentent exactement la valeur de l'entreprise, mais en tout cas on est
09:20 globalement dans des choses qui sont plutôt cohérentes, même si on peut se tromper, le
09:23 marché peut se tromper de plusieurs pourcents, plusieurs dizaines de pourcents, voire même du
09:28 simple au double, mais en tout cas on reste globalement dans la même échelle. Et plus les
09:33 marchés ont évolué, plus les techniques ont évolué, plus ces anomalies se sont résorbées. Et par
09:37 exemple dans les années 80, voire même les années 90, vous pouviez arbitrer de l'IBM qui
09:43 était coté à la fois en dollars à la bourse de New York et puis en francs à la bourse de Paris,
09:47 en Deutschmark, en Allemagne, etc. Vous pouviez comme ça détecter des anomalies et plus ça a
09:54 été fait par beaucoup de traders, plus des modèles de trading se sont mis à le faire, plus ces
10:00 anomalies ont disparu. Et le problème c'est que si effectivement une intelligence artificielle
10:04 arrive à détecter des anomalies de marché, il faut absolument que vous soyez le seul à utiliser
10:09 ce modèle d'intelligence artificielle. Il ne faut pas que ce soit un modèle ouvert comme
10:15 les modèles de Chet-GPT par exemple, utilisé par des milliers de millions de gens. Il ne faut
10:20 absolument pas que ce soit le cas, sinon ces anomalies vont se résorber. D'où toute cette
10:24 culture du secret autour des modèles de renaissance technologie, par exemple, dont on a parlé au
10:28 début, et le fait qu'ils ne peuvent pas avoir trop d'actifs à gérer s'ils ne veulent pas avoir
10:32 leur performance baissée. Cinquième point qui explique pourquoi même si tous les hedge funds
10:37 disent qu'ils veulent faire de l'intelligence artificielle, même si tous les hedge funds
10:40 travaillent dessus, même s'ils essayent d'embaucher des spécialistes d'intelligence artificielle,
10:44 il y en a peu qui mettent réellement de l'argent dessus, en tout cas beaucoup d'argent. C'est que
10:49 les modèles d'IA c'est du machine learning la plupart du temps, c'est-à-dire que vous allez
10:52 balancer des données au modèle et le modèle va vous construire une espèce d'usine à gaz qui va
10:56 vous dire quoi acheter, quoi vendre. Mais ces modèles ne peuvent pas être analysés. En fait,
11:00 la manière dont ils sont faits, la plupart, on ne peut pas faire de reverse engineering,
11:03 on ne peut pas soulever le capot de l'IA et comprendre comment est fait le moteur. Enfin,
11:08 le moteur à la limite on peut le comprendre, mais quelles règles ont été utilisées exactement,
11:14 quelles sont les sources pour nous donner cette stratégie de trading, ça ne se passe pas comme
11:20 ça, ça ne marche pas comme ça. En fait, ça va généralement être vraiment une black box et
11:23 ce n'est pas comme ça que les hedge funds ont été habitués à créer des stratégies de trading. Enfin,
11:28 je dis hedge fund mais ça peut être n'importe quel type de trading. La manière dont ça se passe,
11:32 de manière très standard, c'est qu'on va avoir d'abord une idée, une idée ou bien une intuition,
11:36 on va essayer de tester, de chercher une anomalie ou quelque chose qu'on a vu dans le marché.
11:40 Voilà, on sent qu'il y a quelque chose à faire. On va ensuite développer un modèle avec un certain
11:45 nombre de paramètres, on va tester ce modèle sur des données du passé, on va optimiser nos
11:51 paramètres, on va retester sur d'autres données du passé pour éviter de sur-optimiser le modèle et
11:56 on va mettre ça en production et on va voir si ça marche. L'avantage de ce type de modèle,
12:01 que Stephen Cohen, le fameux gérant de hedge fund, appelle le "man plus machine",
12:05 l'avantage de ce modèle c'est que si ça commence à ne pas marcher, on peut ajuster les paramètres,
12:10 on comprend comment le modèle a été construit, on comprend éventuellement pourquoi le marché
12:14 maintenant agit différemment et est plus rapide, plus lent à s'adapter, peu importe. Donc on arrive
12:19 à comprendre ce qui se passe et on peut faire quelques ajustements. Alors que quand vous avez
12:22 une black box, comment est-ce que vous pouvez corriger ce que le modèle vous a dit si le
12:27 modèle commence à ne plus marcher ? Et pire que ça, déjà comment vous allez vendre à des clients
12:31 le fait qu'ils investissent chez vous mais vous pouvez même pas leur expliquer le coeur de la
12:35 machine, vous pouvez même pas leur donner quelques exemples de règles qui sont appliquées et si ça
12:41 commence à mal tourner, comment vous pouvez l'expliquer aux clients ? Comment est-ce que
12:44 vous pouvez de manière confiante leur dire "non mais il faut absolument rester investi dans cette
12:48 stratégie, là on a eu un drain important mais ne vous inquiétez pas ça va repartir" si vous
12:53 n'avez même pas accès exactement aux règles qui sont appliquées. Et selon moi, une dernière
12:58 différence qui permet d'expliquer pourquoi est-ce que l'intelligence artificielle est très forte
13:02 dans plein plein de domaines mais pas forcément en trading, c'est tout simplement que la plupart des
13:07 intelligences artificielles qu'on voit aujourd'hui ont été entraînées sur des données qui ont été
13:12 générées par les humains. En fait ce que font ces intelligences artificielles c'est tout simplement
13:15 de copier ou plutôt de transformer ce qui a été fait par des humains. Par exemple quand on demande
13:21 à une intelligence artificielle de nous écrire une chanson ou bien de peindre un tableau, le
13:27 tableau va être basé sur des centaines de milliers de tableaux qui ont été numérisés, il va mixer un
13:31 petit peu tout ça, basé sur des mots-clés, il va vous sortir un tableau qui va prendre une partie
13:36 d'une photo, l'inclure dans tel tel décor etc. C'est la même chose par exemple au poker où il
13:43 y a beaucoup de hasards qui sont inclus, je parle pas forcément des échecs mais c'est la même
13:48 chose. En fait ce qui va entraîner le jeu de poker c'est souvent d'étudier des milliers, des millions
13:53 de parties qui ont été jouées pour voir quels sont les coûts qui ont été les plus rentables
13:59 dans une situation donnée. C'est pas forcément de calculer toutes les possibilités, c'est de voir
14:04 comment les humains ont joué et de regarder statistiquement quels sont les coûts qui sont
14:08 les plus favorables dans cette même configuration. Donc on le voit, le fait de copier les humains
14:15 c'est très bien, mais parce qu'on a des super joueurs de poker, on a des très bons joueurs
14:19 d'échecs, on a des super parties qui ont été jouées, pareil on a des très beaux peintres,
14:24 on a des très beaux livres, donc c'est facile de faire écrire un livre, de faire écrire un scénario
14:27 de film, de faire écrire une chanson à chat GPT parce que des humains ont déjà fait ça des milliers
14:32 de fois, des millions de fois, et donc chat GPT va prendre un peu partout des données pour nous
14:37 créer quelque chose de bien. Mais en trading, on le sait très bien, la grande majorité des humains
14:42 sont moins forts que le marché, ils n'arrivent pas à générer une surperformance par rapport au
14:46 marché. Donc chat GPT, enfin je dis chat GPT mais ça peut être n'importe quelle intelligence
14:50 artificielle, n'a tout simplement pas la matière pour trouver des stratégies qui surperforment le
14:56 marché. Donc en fait ce qu'on lui demande c'est beaucoup plus compliqué que juste conduire une
15:00 voiture ou bien faire une peinture, parce que ce qu'on lui demande, on lui demande de faire
15:05 quelque chose qu'on ne sait pas faire, que la plupart des humains n'arrivent pas à faire. Alors
15:08 il y en a quelques-uns comme ça qui sortent du lot, on n'arrive toujours pas à savoir si c'est de la
15:12 chance, si Warren Buffett est là par chance ou non, puisque statistiquement il y a des milliers,
15:17 centaines de milliers de personnes qui ont essayé d'être comme lui, et il y a un seul Warren Buffett,
15:21 donc est-ce que c'est pas finalement purement de la chance ? Ça on n'arrive pas à le déterminer,
15:24 je vous renvoie au livre de Nassim Taleb si vous vous posez des questions sur le hasard. Donc vous
15:30 voyez on demande quelque chose qui est beaucoup plus compliqué en fait à une intelligence
15:34 artificielle, alors qu'on a l'impression en surface que c'est la même chose finalement,
15:37 comme il a beaucoup de données, on lui demande d'optimiser une stratégie de trading, tout comme
15:44 on va lui demander plein d'autres choses, mais en fait ça n'a rien à voir et je pense qu'aujourd'hui
15:49 l'intelligence artificielle n'est pas au niveau. Alors soyons clairs, je suis persuadé qu'à un
15:54 moment ça va arriver, à un moment il y a quelqu'un qui va arriver à utiliser l'intelligence artificielle
16:00 et qui va avoir suffisamment confiance en son modèle, même s'il ne le connaît pas complètement,
16:04 pour mettre de l'argent dessus et pour générer de gros revenus. Alors j'aimerais vous trouver
16:08 comme ça des fonds qui sont basés à 100% sur l'intelligence artificielle et qui performent
16:12 énormément. J'aimerais vous dire que Renaissance Technologies dont on a parlé au début, que son
16:15 fonds Médallion est basé sur l'intelligence artificielle, le problème c'est que c'est le
16:18 seul exemple qu'on ait et on n'est pas sûr que ce soit 100% de l'intelligence artificielle qui
16:24 soit utilisée, non pas des modèles statistiques comme font la plupart des hedge funds quantitatives.
16:30 Voilà pour mes théories en fait sur ce qui explique pourquoi l'IA n'est pas très forte en
16:35 trading. Est-ce que vous pensez la même chose que moi ou est-ce que vous pensez qu'il y a d'autres
16:39 raisons qui peuvent expliquer pourquoi l'intelligence artificielle a si peu de succès ? En fait c'est pas
16:44 qu'elle n'est pas utilisée, c'est qu'elle a si peu de succès en trading ou en tout cas pas à ma
16:48 connaissance. Et si vous connaissez des fonds à part le fond Médallion qui sont basés à 100% sur
16:53 l'intelligence artificielle et qui cartonnent, qui ont des super performances, n'hésitez pas à me le
16:57 mettre en commentaire. Voilà pour aujourd'hui, merci encore pour votre fidélité, vos likes,
17:01 vos partages, vos notes sur le podcast, c'est vraiment super sympa et moi je vous dis à bientôt
17:05 pour une autre émission.

Recommandations