ETONNANT, DERANGEANT, MAIS FORMATEUR

Apprentissage de systèmes de trading sur données synthétiques générées aléatoirementEt bien entendu, la question principale est : Mais comment cela est - il possible ? La réponse, détaillée, se trouvera dans ces pages, texte et vidéo à l'appui.

Pourquoi faire apprendre des systèmes de trading sur des données générées aléatoirement ?

L’histoire en bref

En  2004,  l’auteur a publié un  ouvrage critique sur l’analyse technique, montrant par l’expérience que  les marchés ne sont pas aléatoires et  peuvent être partiellement  modélisés par intelligence artificielle  à  partir de tendances créées sur des cours fictifs, excluant tout apriori dogmatique.

En  2020,  l’auteur a refait ces  expériences avec  les mêmes  outils améliorés, et a publié sur ce  site les  vidéos  complètes de l’expérience. 

Les conclusions de  2004 sont  confirmées. Il est donc possible de modéliser des systèmes trend  following en leur faisant apprendre des trends générés aléatoirement.

 L’expérience est  présentée à chaque fois en vidéo complète avec test sur données non vues.

L'expérience publiée en 2004 : à lire ou à relire...

L’idée peut paraître saugrenue, déjà que  faire des systèmes de  trading  de façon  classique (et qui  fonctionnent longtemps), ce n’est  pas forcément évident.

Celle-ci  provient d’un livre critique sur  l’analyse technique  (Les  systèmes de  trading …et quelques  controverses sur  l’analyse  technique des  marchés financiers) ,  publié en  2004 , épuisé et non réédité, où j’y avais  montré que le  logiciel d’intelligence artificielle  Safir-Xp pouvait apprendre sur des cours de bourse fictifs,  générés à  partir de  données  certifiées aléatoires (séries de  0 et 1, acquises pour  l’occasion), et transformées en  cours de bourse par concaténation (en faux tick by tick, donc). 

Les  systèmes de trading  ainsi produits, ne devant pourtant rien à la  magie de  la Finance et de l’analyse technique  réunies pouvaient  fonctionner de façon relativement acceptable sur des contrats de  futures.

Au choix, l’expérience  de 2004 confirmait que  les données de  marché ne sont pas aléatoires, que  le logiciel Safir-Xp fonctionnait et suggérait que  l’analyse technique  empirique reposait  sur une  croyance  pour partie légitime, mais pas que…

epuisé

Publié en juillet 2004

Publié en juillet 2004 (épuisé, non réédité)

PAPIER Éditeur(s) Gualino Auteur(s) Pierre Orphelin Collection City and York Parution 16/07/2004 Nb. de pages 368 Format 17 x 22 Couverture Broché Poids 645g Intérieur Noir et Blanc EAN13 9782842004965 ISBN13 978-2-84200-496-5

L’expérience  originale de 2004 est décrite  dans  les  chapitres  2 et  3 du  livre Les systèmes de trading …et quelques controverses sur l’analyse technique des marchés financiers que  vous  pouvez  consulter au  format  PDF en français et en anglais (traduction  machine  par DeepL) .

Chapitre 2 ( PDF) :  →
Les marchés sont-ils ou non aléatoires ?

Ce  chapitre  explique  la genèse de  cette vérification.

Chapitre 3 (PDF) :  →
L’analyse technique et le hasard.

Ce  chapitre  décrit  l’expérience de vérification, les résultats et en tire de multiples conclusions  

Chap2_3FR
Chap2_3USx
Traduction machine DeepL

L'expérience de  2004, refaite en  2020 et enregistrée intégralement en  vidéo 4k  

Les données pseudo aléatoires confirment

En  2004, les données aléatoires étaient transformées en  barres   fictives de  x minutes.  Les  conditions pour que  le  logiciel trouve  des solutions n’étaient  pas  optimales, et  pourtant le résultat était quand  même  là. 

Quelques  critiques  arguant  insidieusement  d’un bug  logiciel m’ont conduit  à refaire  l’expérience, cette  fois en vidéo et avec les derniers travaux.

  On  prendra cette  fois des données  pseudo  aléatoires  générées à  la demande (aucun  biais  possible, les  séries   changent à  chaque rechargement du fichier) . 

Et au  lieu d’utiliser des barres  de X  minutes, ce sont des barres filtrées ( X  bars,  propriétaires) , mais  toujours  générées à  partir de séries chronologiques pseudo  aléatoires.

 

 Depuis, l’approche a été raffinée et avec  la  version SAFIR-Xp 2020, les  résultats  sont exploitables plus  facilement.

Pour rester au  plus  près de l’expérience de  2004 et  pour avoir  des  résultats  systématiquement  positifs,  les   Xbars sont à un  niveau de filtrage  minimal. Vous  verrez dans  l’expérience  suivante qu’on peut  largement améliorer le système.

Pour  l’heure, il s’agit de montrer que l’expérience de  2004 se  généralise apprentissage sur des données aléatoires et test sur  données  non vues de marché, et encore plus  facilement et de façon  répétitive qu’en 2004.

Le  nombre  d’expériences réalisées dans ces  vidéos à  partir de  données  pseudo aléatoires permet de tirer les  mêmes conclusions qu’en  2004.

Des perspectives nouvelles avec les données pseudo aléatoires

  Cette section du site  vous  propose des  videos en  haute définition (UHD  4K)  montrant  les  différents aspects du  concept et son application  pratique ( la mise en place des différentes phases lors du fonctionnement filmé de  la suite  logicielle).

Les avantages sont  multiples dès lors que  la pratique s’avère  robuste :

Plus  besoin de choisir les données  d’apprentissage : Toutes  vos  données  de  marché même les plus anciennes sont  des données  non  vues utilisables en test, l’apprentissage  sur  données aléatoires  ne peut  pas  les avoir vues, et elles  ne sont  pas reproductibles.  

Pas besoin de version de démonstration  du  logiciel, les  vidéos montrant le fonctionnement du  logiciel suffisent.
Il y en  aura ici assez et  variées. 

Le track record, preuve reine  de  la  validité d’un système de  trading peut  être avantageusement remplacé ou du  moins  étayé  par un track record  simulé, y compris sur un passé ancien. 

 Et donc, pas besoin de  publier des résultats en  temps  réel, les  vidéos de développement et de backtest sur données  de  marché vraiment non vues doivent permettre de se  faire une  idée de la  validité des  systèmes beaucoup  plus  rapide que d’attendre  des  mois  ou des années de  mise en production.
 Plus  d’explications à  venir sur ces avantages.

(1)Les systèmes de trading et quelques controverses sur l’analyse technique des marchés financiers . 367 pages  Edition: Paris : Gualino, 2004 –Auteur du texte : Pierre Orphelin

Mais  attention,  tout  ceci est conditionné impérativement par des tests exhaustifs  sur  les données de  marché, obligatoires et extrêmement soignés (pas de data snooping).

  • Les biais  cognitifs  habituels  ne  sont  pas évités si vous  choisissez des  systèmes qui ne généralisent  pas suffisamment.
  • L’utilisation du  money  management dynamique du  portefeuille  atténue cet inconvénient, mais ne  le supprimera  jamais complètement.
  • Nous verrons  plus  loin deux autres  méthodes hybrides encore plus intéressante à  partir de données pseudo aléatoires biaisées ou de  transfert de bruit réel sur des trends aléatoires.
  • Pour  l’heure, on vérifiera l’expérience de  2004 avant de passer à  la  suite. 
  • Les quatre vidéos suivantes (2020) commentées  doivent  répondre à la plupart des questionnements de l’expérience de 2004.

1- Apprentissage de systèmes de trading sur données aléatoires par intelligence artificielle et test sur données de marché

Première video sur une série concernant le trading automatique par intelligence artificielle en utilisant des données  synthétiques pour l’apprentissage avec SAFIR-Xp  2020.
 Ici l’apprentissage est fait non pas sur des données de marché , mais sur des cours synthétiques générés par des fonctions aléatoires.

 Les systèmes ainsi obtenus sont ensuite appliqués à des vraies données de marché.

L’expérience est faite en vidéo au  format 4k, tous les détails sont bien visibles.
Les enregistrements ont été  faits en une seule  prise, vous comprendrez  pourquoi, cela  fait  partie de  la démonstration  et  de l’explication de l’approche  de la  suite  logicielle TTSF qui  cherche dans  sa  méthodologie à éviter  les problèmes  d’optimisation, de  data snooping et autres  biais cognitifs.

Play Video

2 -Nouvelles données aléatoires sur portefeuille de test (entraîné sur d'autres données aléatoires) : Vérification de 2- l'impossibilité à obtenir des résultats

Voici une preuve expérimentale que l’inverse ne peut pas fonctionner, sauf par hasard. Il est possible d’apprendre les systèmes de trading à partir de données aléatoires (une fois sélectionnées). Ils pourraient alors fonctionner sur des données réelles du marché, mais pas sur un autre ensemble de données aléatoires. 

Ceci est interdit par le Théorème central limite. 

Ont été ajoutées à la fin de la  vidéo quelques remarques sur la différence indécelable visuellement entre les données aléatoires et les données de marché. Une bonne raison d’être prudent avec l’analyse technique graphique des marchés financiers. Ce que vous voyez sur le graphique n’est peut-être pas ce que vous croyez y voir…

Play Video

3- Systèmes de trading apprenant sur données aléatoires OU sur données de marché: Comparaison des deux approches (PARTIE 1/2)

 La suite logique de la série sur l’apprentissage de systèmes de trading par intelligence artificielle. 

La possibilité d’apprendre sur des cours synthétiques est bien réelle et permet d’obtenir des systèmes de trading qui généralisent de façon inattendue (pour nombre de personnes) sur des vraies données de marché.

Mais alors, comment se positionne cette approche par rapport à la démarche classique ? Il suffit de regarder les deux vidéos ( PART 1 et 2, ), enregistrées en direct sans présélection et dans moins de 16 minutes vous aurez plus qu’un embryon de réponse.

Play Video

4- Systèmes de trading apprenant sur données aléatoires OU sur données de marché: on compare (PARTIE 2/2)

 La suite logique de la série sur l’apprentissage de systèmes de trading par intelligence artificielle. La possibilité d’apprendre sur des cours synthétiques est bien réelle et permet d’obtenir des systèmes de trading qui généralisent de façon inattendue ( pour nombre de personnes) sur des vraies données de marché. Mais alors, comment se positionne cette approche par rapport à la démarche classique ? Il suffit de regarder les deux vidéos ( PART 1 et 2, celle ci est la seconde), enregistrées en direct sans présélection et dans moins de 16 minutes vous aurez plus qu’un embryon de réponse.

Play Video