par Maxim Sytchev 27 novembre 2004 Université de Sherbrooke

Mémoire M.Sc.Prévisions multivariées dynamiques non paramétriques de l’indice S&P/TSX Total Return par le biais de l’analyse des composantes indépendantes (« ICA ») par Maxim Sytchev 27 novembre 2004 Université de Sherbrooke

Plan • Justifications de l’utilisation des modèles non paramétriques multivariés pour des prévisions boursières • Présentation de résultats des tests chaotiques • Hurst • Dimension de corrélation • Lyapunov • Présentation du modèle de prévisions • l’analyse en composantes indépendantes (Independent Component Analysis (« ICA ») avecla régression non paramétrique par noyau (« Kernel ») • Analyse d’efficacité des prévisions selon les critères suivants: • Risque / rendement • Direction • Statistiques • Sans test de l’inférence • Avec test de l’inférence (Diebold-Mariano 1995) • Applications futures de notre méthodologie • Conclusion

Notre méthodologie est nettement distinctive • Utilisation de l’ICA pour extraire des facteurs • Prévisions non-paramétriques: amalgamation de ICA et la régression par noyau

Justifications de l’utilisation des modèles non paramétriques multivariés pour des prévisions boursières • Le marché boursier est influencé par des événements « non prévisibles » du monde physique où la linéarité est rare (Gleick 1987) • Barnett and Serletis (2002): “… the economy is subject to shocks from the surrounding nonlinear or chaotic physical environment… “ • Les outils statistiques linéaires ne sont pas suffisamment proche de la réalité selon nos tests linéaires + chaotiques • Régression linéaire • ARIMA • Analyse en composante principales (« PCA ») • Le marché canadien (S&P/TSX Total Return) ne conforme pas à la normalité + démontre la dépendance à longue terme

Marché canadien (titres individuels et S&P/TSX Total Return) • Description de données: • 1. Jan 1952-Dec 1961 (138 titres) • 2. Jan 1962-Dec 1971 (215 titres) • 3. Jan 1972-Dec 1981 (188 titres) • 4. Jan 1982-Dec 1991 (268 titres) • 5. Jan 1992-Dec 2001 (249 titres)

S&P/ TSX Total Return (février 1956-decembre 2001) standardisé 70 60 50 40 30 20 10 0 -1.25 -5.25 -4.25 -3.25 -4.75 -3.75 -2.75 -2.25 -1.75 1.25 2.25 2.75 1.75 3.25 -.75 .75 .25 -.25

Test de dépendance - Hurst Conclusion: il y a une dépendance à long terme

Test de complexité – dimension de corrélation Conclusion: Moins complexe qu’aléatoire, peu de chance d’être chaotique

Test de i.i.d – BDS Conclusion: Non i.i.d.

Test de chaos – Lyapunov selon NEGM (’92;’96) Conclusion: Non chaotique si les ajustements adéquats sont fait

ICA en principe • x sont des vecteurs multivariés utilisés pour rentrer dans ICA ({xi(t)}, i=1,…, n). Nos vecteurs sont des rendements totaux des titres i au temps dans période n (5 période d’extraction) • Assumons que peuvent être reconstruit par le biais d’une mixture linéaire de j facteurs(composantes indépendantes). La mixture est déterminée par la matrice de « factor loading » (sensibilité de chaque titre à une composante). Dérivation des composantes inconnues est faite en trouvant une matrice W • telle que S(t) = y(t) = Wx(t) = WAs(t),ou A est une matrice inconnue • Nous supposons que A est une matrice carrée. Si W=A-1, il y a une séparation parfaite des signaux. En réalité, la matrice W est telle que WA=PD, ou P est une matrice de permutation et D est une matrice diagonale (Tong et al., 1991). Les itérations arrêtent quand les composantes sont complètement indépendantes l’une de l’autre. Ceci est accompli par une minimisation des mesures d’ordres élevés: • kurtosis, • information mutuelle, • negetropies, et • d’autres mesures provenant d’une théorie de l’information

Kernel régression (méthodologie) • Nous adhérons à la théorie de Takens (1981) pour faciliter le lien entre la kernel régression et la théorie des systèmes dynamiques. • Une série scalaire { } ( ) est enclavé (“embedded”) dans un espace à m dimensions ou espaces d’états (“phase space”): ou • = le retard temporel • m = le nombre de dimension de l’espace d’états • t = 1, T-m+1 est la longueur de la série scalaire • Pour faire des prévisions non paramétriques, • identifions l’état présent du système, c’est à dire le vecteur de dimension • Trouvons s < t = 1, T-m+1 espace qui sont “proches” du vecteur présent en terme de proximité spatiale.

Kernel régression (méthodologie) continue • Dès que nous avons obtenues des vecteurs proches, nous évoluons des « images » de ces s vecteurs j pas à la fois: • a la forme générale = • Pour produire des images fidèles, il faut identifier: • Le nombre s des vecteurs • le type de proximité • Le type de noyau (kernel) • L’identification est faite par le biais d’une méthodologie de contre-validation: • La série temporelle est séparée en deux • La première partie est utilisée pour calibrer • La deuxième partie est utilisée pour estimer la correction des prévisions • Un poids différant à partir de noyau (« kernel ») est assigné à chaque de s images • «La moyenne » de s images devient une prévision pour l’état présent du systeme

Proximité Noyaux (« kernels ») Type de proximité et type de noyau

Model de prévision • Extraire des facteurs avec ICA dans 5 periodes • Rassembler les facteurs de chaque période en facteurs continus (« global independent components » = GLIC), qui se repend tous les 5 périodes: • c’est-à-dire composante 1 de période 1 est imbriquée avec composante n de période 2, etc. • Identifier une période d’entraînement – 24 mois (« in-sample out-of-sample ») ou l’optimisation de paramètres est fait de type: • Nombre de s vecteurs • Type de proximité • Type de noyau (« kernel ») • Optimisation de Newton pour déterminer le poids attribués à chacune des GLICs ainsi que S&P/TSX Total Return dans une période d’entraînement • = modèle à 4 variables (3 GLICs et l’indice S&P/TSX Total Return) • Faire des prévisions – 24 mois (« out-of-sample ») de chaque série (3 GLIC et S&P/TSX Total Return avec des régressions à noyau tenant compte des même paramètres que déterminés pendant la période d’entraînement. Combiner les prévisions selon la formule:

Résultats • Nous évaluons nos prévisions en créant une stratégie de « trading » sur 24 mois (Jan 2000 – Dec 2001). • Biais d’une période relativement courte de l’évaluation des prévisions est minimisé par une décision d’investissement chaque mois (24 mois) – position « long » ou « court ». • Notre modèle de trading est évalué contre 12 modèles: • 8 - dynamique non paramétriques multivarié • 1 - dynamique non paramétrique univarié • Naïf • AR(1) • ARMA avec erreurs modélisés par GARCH

Caractéristiques dynamiques du modèle

Stratégie de « trading » mensuelle

Prévisions - sans test de l’inférence

Divergence directionnelle des prévisions

Comparaison entre modèle naïf et univarié

Diebold-Mariano (NN-TSX NN-GLICS)

Prévisions non-paramétriques: conclusions • Surperformance du modèle non-paramétrique NN-TSX NN-GLICS (EUCLIDIAN 1-month) selon des critères: • Non-inferentielle, sauf (MPE), • Directionnelle, • Rendement/risque • Diebold-Mariano: • Erreurs carrés – pas de différence contre aléatoire • Erreurs absolus – différence contre aléatoire, mais pas dynamique univarié

Interprétation des facteurs ICA (GLICs) selon la théorie financière et économiques par le biais de régression « step-wise » • Liquidité domestique et internationale du Canada • Commodités • Le taux d’échange US/Can. • Le portefeuille du marché (S&P/TSX Total Return)

Futures études • Autres algorithmes ICA avec notre modèle de prévision • Analyse des donnés d’autre fréquences (ex. journaliers) ou dans les autres marchés • Corrélation de facteurs ICA avec variables fondamentales (Book/Market, Size, momenum, etc.), momentum ou Fama-French

Conclusion • Les prévisions financières qui incorporent la non linéarité et des outils non paramétriques sont plus performant que les modèles stochastiques paramétriques selon les critères risque / rendement. • Application de ICA en finance doit être de plus en plus répendu car sa performance est hautement supérieure à celle de l’analyse factorielle et PCA (*). • Futurs modèles de prévision devraient incorporer des algorithmes de plus en plus performant de ICA. • Le succès de notre méthodologie confirme indirectement l’utilité de l’analyse technique (Clyde et Osler, ’97; Auloos ’00). (*) Sytchev 2004.

par Maxim Sytchev 27 novembre 2004 Université de Sherbrooke