Leroux, Maxime
(2024).
« Trois essais sur la prévision macroéconomique » Thèse.
Montréal (Québec), Université du Québec à Montréal, Doctorat en économique.
Fichier(s) associé(s) à ce document :
Résumé
Cette thèse est formée de trois chapitres ayant pour sujet l’utilisation du Machine Learning en prévision macroéconomique dans un environnement riche en données. Le premier chapitre propose comme nouveau modèle de prévision le Regularized Data-Rich Model Averaging (RDRMA) et compare sa performance avec celle de cinq autres catégories de modèles pour la prévision de plusieurs variables macroéconomiques. Les principaux résultats se résument en quatre points. Premièrement, le RDRMA performe généralement mieux que les autres modèles et particulièrement pour les variables réelles. Nous attribuons cette performance à l’utilisation conjointe de la régularisation et de la combinaison de modèles. Cela confirme que de larges ensembles de données peuvent mener à des gains prévisionels substantiels par rapport à des approches univariées en utilisant intelligemment ces deux approches. Deuxièmement, le modèle ARMA(1,1) ressort vainqueur pour la prévision de la variation de l’inflation à court terme alors que le RDRMA domine à plus long terme, Troisièmement, les rendements du SP500 sont prévisibles par le RDRMA à court terme. Finalement, les performances prévisionnelles et les choix optimaux de régresseurs sont très instables à travers le temps. Le deuxième chapitre met en évidence les différences dans l’effet des transformations de données lorsque le modèle de prévision est linéaire et lorsqu’il utilise de la régularisation ou est non-linéaire. Il évalue ensuite empiriquement l’utilité de nouvelles transformations dans un exercice de prévision pseudo hors échantillon. Les résultats montrent que les premières composantes principales des données devraient généralement être incluses comme régresseur et que des moyennes mobiles peuvent générer d’importants gains pour plusieurs variables macroéconomiques. Par ailleurs, si prévoir directement le taux de croissance moyen et combiner la prévision des taux de croissance simple n’a que peu d’importance en utilisant les moindres carrées ordinaires, il en est tout autrement lorsque le modèle utilise de la régularisation ou est non linéaire. Dans ce dernier cas, combiner les prévisions des taux de croissance simple plutôt que de prévoir le taux de croissance moyen directement peut grandement améliorer la performance prévisionelle. La littérature en prévision macroécomique propose généralement de nouvelles méthodes permettant d’améliorer la performance prévisionnelle pour certaines variables et certains horizons. Le troisième chapitre de cette thèse répond plutôt à la question suivante : How is Machine Learning Useful for Macroeconomic Forecasting ? Alors que vérifier si un modèle améliore la performance prévisionnelle nécessite uniquement une comparaison avec un modèle de référence, déterminer d’où provient les gains prévisionnelles nécessite nécessairement d’identifier des sources possibles. Ce chapitre explore donc l’utilité de quatre composantes qui caractérisent un modèle de prévision ; la non-linéarité, la régularization, la méthode de sélection des hyperparamètres et le choix de la fonction de perte. Pour ce faire, une expérience est construite afin d’identifier les effets associés à ces caractéristiques en distinguant l’environnement pauvre en données de l’environnement riche en données. Les résultats montrent (1) que la non-linéaire est la principale caractéristique qui améliore la prévision macroéconomique, (2) que l’utilisation des premières composantes principales est la meilleure façon de considérer des grands ensembles d’information, (3) que l’utilisation de la validation croisée K-fold est à privilégier et (4) que la fonction de perte L2 est plus appropriée que la fonction de perte E-insensitive. De plus, les gains prévisionnels résultants de la nonlinéarité sont associés avec des épisodes d’incertitude macroéconomique, de pressions financières et de l’éclatement de bulles immobilières.
_____________________________________________________________________________
MOTS-CLÉS DE L’AUTEUR : modèles riche en données, Modèles à facteurs, Prévision, Combinaison de modèles, Modèles sparse, Régularisation, Apprentissage automatique, Transformation de données