Estimation de l'historique démographique d'une population de virus à partir de séquences d'ADN par la théorie de coalescence

Ait Kaci Azzou, Sadoune (2016). « Estimation de l'historique démographique d'une population de virus à partir de séquences d'ADN par la théorie de coalescence » Thèse. Montréal (Québec, Canada), Université du Québec à Montréal, Doctorat en mathématiques.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (13MB)

Résumé

L'évolution de la taille d'une population peut être retracée à partir d'un échantillon de séquence d'ADN. Dans cette thèse, nous proposons une nouvelle méthodologie non paramétrique basée sur une stratégie d'échantillonnage pondéré (Importance Sampling) qui permet d'explorer de tels historiques démographiques. L'essence de la méthode est de simuler un grand nombre de généalogies en utilisant le processus de coalescence, où l'information fournie par ces généalogies est combinée en utilisant les poids de cet échantillonnage pondéré. En premier, nous proposons la méthode skywis plot qui débute par l'estimation de la taille de la population effective pour chaque généalogie, pour chaque intervalle de temps prédéfini, appelé époque; ensuite, une moyenne pondérée de ces tailles de population estimées est calculée. Ainsi, les généalogies qui sont le plus en accord avec les données ont un poids plus élevé. Nous avons aussi généralisé notre méthodologie au cas d'un échantillonnage en série. Cela a nécessité la mise en œuvre d'une stratégie d'échantillonnage efficace qui permet de tenir compte de cette réalité qui est très utilisée, notamment dans le cas de virus qui évoluent rapidement comme le VIH. Ensuite, nous proposons d'améliorer la performance de la méthode skywis plot à travers une procédure itérative appelée iterative calibrated skywis plot; la taille de la population effective est approximée par une fonction en escalier, qu'on ré-estime après chaque itération en utilisant la méthode calibrated skywis plot. Ces fonctions en escalier sont utilisées pour générer les temps d'attente d'un processus de Poisson non homogène (coalescence avec mutation) sous un modèle avec une taille de population variable. Cela nous a aussi amené à adapter la distribution proposée de Stephens et Donnelly (2000). ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : historique démographique, échantillonnage pondéré, processus de coalescence, skywis plot, échantillonnage hétérochrone, processus non homogène.

Type: Thèse ou essai doctoral accepté
Informations complémentaires: La thèse a été numérisée telle que transmise par l'auteur.
Directeur de thèse: Larribe, Fabrice
Mots-clés ou Sujets: Population -- Histoire / Théorie de la coalescence / Génétique des populations / Échantillonnage (Statistique) / Échantillonnage pondéré / Séquence nucléotidique / Virus -- Évolution
Unité d'appartenance: Faculté des sciences > Département de mathématiques
Déposé par: Service des bibliothèques
Date de dépôt: 28 juill. 2016 17:33
Dernière modification: 28 juill. 2016 17:33
Adresse URL : http://archipel.uqam.ca/id/eprint/8751

Statistiques

Voir les statistiques sur cinq ans...