Identification de modèles appropriés pour l'inférence causale à partir de données d'observation

Talbot, Denis (2015). « Identification de modèles appropriés pour l'inférence causale à partir de données d'observation » Thèse. Montréal (Québec, Canada), Université du Québec à Montréal, Doctorat en mathématiques.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (19MB)

Résumé

L'inférence causale permet de tirer des conclusions sur des relations de cause à effet à l'aide d'observations empiriques. Alors que l'inférence causale peut généralement s'effectuer assez facilement à l'aide de données provenant d'études randomisées, il en va autrement lorsque des données d'études observationnelles sont utilisées. Toutefois, les études randomisées ne sont pas toujours possibles. Dans cette thèse, nous abordons la problématique de la sélection de modèles visant l'inférence causale à l'aide de données d'observation sous deux angles distincts. Dans un premier temps, nous abordons le contexte où les connaissances substantielles (c'est-à-dire du domaine d'application) sont peu développées. Nous étudions la méthode de sélection de modèles pour l'inférence causale Bayesian Adjustment for Confounding (BAC) et présentons des développements récents par rapport à cette méthode. Notamment, une justification plus formelle à la validité de BAC pour l'estimation de l'effet causal d'exposition ainsi que des procédures visant à choisir une valeur de l'hyperparamètre w de BAC minimisant l'erreur quadratique moyenne (EQM) sont étudiées. La performance de BAC en termes d'EQM se révélant décevante, nous élaborons une nouvelle approche de sélection de modèles pour l'inférence causale, Bayesian Causal Effect Estimation (BCEE). BCEE partage certaines similarités avec BAC ainsi qu'avec le modèle moyen bayésien. Cependant, contrairement à ces approches, BCEE est motivée par le paradigme graphique causal. Les études de simulations réalisées suggèrent que BCEE permet généralement de réduire au moins légèrement, et parfois notablement, l'EQM de l'estimateur de l'effet causal d'exposition par rapport à un modèle de réponse complet et par rapport à BAC. La performance de BCEE peut même approcher celle du vrai modèle d'exposition dans des conditions idéales. Dans un deuxième temps, nous abordons la sélection de modèles pour l'inférence causale dans un contexte où les connaissances du domaine d'application sont plus développées. Une méthodologie statistique utilisant les modèles structuraux marginaux (MSMs) et ayant servi à analyser les données du Honolulu Heart Program est décrite. Cette analyse visait à estimer les relations causales entre l'activité physique, la tension artérielle et la mortalité. La méthodologie développée comporte plusieurs éléments novateurs, dont une utilisation élargie du paradigme graphique à l'inférence causale, la validation et l'amélioration de graphes acycliques orientés à l'aide de modèles d'équations structurelles ainsi que l'introduction de MSMs conditionnels à des variables variant dans le temps. Pour l'application étudiée, l'approche proposée facilite la sélection des variables utilisées pour la pondération des MSMs, étape charnière et complexe de l'implantation de ces modèles. Finalement, nous étudions le choix d'une stabilisation des poids utilisés pour les MSMs en relation avec le modèle structurel choisi. Il est montré que la stabilisation des poids des MSMs peut non seulement avoir un impact sur la variance des estimateurs obtenus, mais également sur leur biais. À l'aide d'un exemple illustratif puis d'études de simulations, nous démontrons que les poids stabilisés usuels peuvent conduire à des estimateurs biaisés lorsque le modèle structurel implanté n'inclut pas l'ensemble de l'historique d'exposition alors que le modèle structurel réel dépend de l'ensemble de l'historique d'exposition. Par contre, les poids stabilisés simples se révèlent être robustes au biais introduit par une telle erreur de spécification du modèle. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Inférence causale, sélection de modèles, confusion, variable confondante, modèles structuraux marginaux, pondération par probabilité inverse.

Type: Thèse ou essai doctoral accepté ()
Informations complémentaires: La thèse a été numérisée telle que transmise par l'auteur.
Directeur de thèse: Lefebvre, Geneviève
Mots-clés ou Sujets: Inférence (Logique) / Causalité / Inférence causale / Statistique
Unité d'appartenance: Faculté des sciences > Département de mathématiques
Déposé par: Service des bibliothèques
Date de dépôt: 03 mai 2016 19:03
Dernière modification: 03 mai 2016 19:03
Adresse URL : http://archipel.uqam.ca/id/eprint/8372

Statistiques

Voir les statistiques sur cinq ans...