Nouveaux algorithmes pour l'inférence de réseaux phylogénétiques

Willems, Matthieu (2018). « Nouveaux algorithmes pour l'inférence de réseaux phylogénétiques » Thèse. Montréal (Québec, Canada), Université du Québec à Montréal, Doctorat en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (16MB)

Résumé

La théorie de l'évolution de Darwin, puis la découverte de l'ADN (acide désoxyribonucléique) dans les années 1950 ont donné naissance à la phylogénie moléculaire, dont le but principal est de construire des arbres d'espèces à partir de données moléculaires (essentiellement de l'ADN ou des protéines). De nombreux algorithmes ont été développés dans ce contexte. Les méthodes de distances sont les plus rapides, tandis que les méthodes basées sur les caractères donnent généralement de meilleurs résultats mais nécessitent des temps de calcul beaucoup plus importants. Par ailleurs, plusieurs phénomènes évolutifs fondamentaux, comme l'hybridation, ne peuvent pas être représentés par un arbre phylogénétique. Il faut alors considérer des réseaux phylogénétiques. Plusieurs méthodes d'inférence de tels réseaux ont été introduites depuis une vingtaine d'années. La plupart d'entre elles produisent des réseaux implicites, qui peuvent s'avérer très difficiles à interpréter. Notre premier projet a ainsi consisté à développer un algorithme pour inférer un réseau d'hybridation explicite à partir d'une matrice de distances entre un certain nombre d'espèces. Des simulations et des tests sur des données réelles nous ont permis de mettre en lumière l'efficacité de notre nouvel algorithme. Notre programme est disponible en ligne pour l'ensemble de la communauté scientifique. Dans un deuxième temps, nous avons appliqué notre nouvelle méthodologie dans le cadre de la biolinguistique. L'évolution des langues peut en effet être représentée sous la forme d'un arbre ou d'un réseau, et plusieurs études ont démontré la pertinence d'appliquer des méthodes d'inférence phylogénétique à des données linguistiques. Nous avons ainsi reconstruit un réseau d'hybridation explicite représentant l'histoire de 84 langues indo-européennes, et nous avons comparé ce réseau à ceux obtenus à partir d'autres méthodes. Enfin, dans notre troisième projet, nous avons développé une méthode d'inférence de réseaux phylogénétiques basée sur les caractères. Notre algorithme prend en entrée une séquence binaire (correspondant, par exemple, à la présence ou l'absence de certains gènes) pour chaque espèce considérée, et reconstruit un réseau phylogénétique explicite, dont les feuilles sont en correspondance avec les espèces considérées. Plusieurs simulations ont montré que cet algorithme donne de meilleurs résultats que notre méthode de distances, même si les temps de calculs sont généralement plus longs. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Réseaux phylogénétiques, hybridation, neighbor-joining, maximum de vraisemblance, biolinguistique.

Type: Thèse ou essai doctoral accepté
Informations complémentaires: La thèse a été numérisée telle que transmise par l'auteur.
Directeur de thèse: Makarenkov, Vladimir
Mots-clés ou Sujets: Réseau phylogénétique / Phylogenèse / Hybridation / Algorithmes / Neighbour joining / Biolinguistique
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 15 oct. 2018 08:54
Dernière modification: 15 oct. 2018 08:54
Adresse URL : http://archipel.uqam.ca/id/eprint/11720

Statistiques

Voir les statistiques sur cinq ans...