L'indice de transfert, NetUniFrac et quelques distances de plus courts chemins utiles pour l'analyse de communautés dans les réseaux de similarité de séquences

Xing, Henry (2020). « L'indice de transfert, NetUniFrac et quelques distances de plus courts chemins utiles pour l'analyse de communautés dans les réseaux de similarité de séquences » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (2MB)

Résumé

Les arbres phylogénétiques et leurs méthodes d’analyse ont joué un rôle-clé dans plusieurs études d’évolution, d’écologie et de bioinformatique. Alternativement, les réseaux phylogénétiques ont aussi été largement utilisés dans l’analyse et la représentation des processus d’évolution complexes, qui ne peuvent être étudiés adéquatement par les méthodes phylogénétiques traditionnelles. Ces processus incluent, entres autres, l’hybridation, les transferts horizontaux de gènes (THG) et la recombinaison génétique. De nos jours, les réseaux de similarités de séquences (RSS) et similarités de génomes deviennent des outils efficaces pour l’analyse de communautés dans des jeux de données moléculaires. Ces réseaux peuvent être utilisés pour une variété de problèmes d’évolution, tels que l’identification des THG, des gènes et génomes mosaïques, et l’étude des holobiontes. Les plus courts chemins dans un arbre phylogénétique permettent d’estimer la distance d’évolution entre les espèces. Nous montrons comment le concept des plus courts chemins peut être étendu aux RSS avec cinq nouvelles distances, soient NetUniFrac, Spp, Spep, Spelp et Spinp, et l’indice de Transfert. Ces nouvelles distances peuvent être vues comme analogues de la distance traditionnelle UniFrac appliquée sur les arbres pour mesurer la dissimilarité entre des communautés d’espèces, alors que l’indice de Transfert sert à estimer le ratio et la direction des transferts, ou la dispersion des espèces, entre différentes communautés d’espèces phylogénétiques ou écologiques. De plus, NetUniFrac et l’indice de Transfert peuvent être calculés dans un temps linéaire par rapport au nombre d’arêtes dans le réseau. Nous montrons comment ces nouvelles mesures sont utilisées pour analyser des réseaux de microbiomes et de gènes de résistance aux antibiotiques (GRA). Notre programme NetFrac, implémenté en R et en C, avec les codes sources, est disponible gratuitement sur GitHub à l’adresse URL suivante : https://github.com/XPHenry/Netfrac. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Phylogénie, réseau de similarités de séquences, réseau phylogénétique, plus court chemin, transferts horizontaux de gènes.

Type: Mémoire accepté
Informations complémentaires: Fichier numérique reçu dans le cadre du dépôt numérique et enrichi en format PDF / A.
Directeur de thèse: Makarenkov, Vladimir
Mots-clés ou Sujets: Phylogenèse / Réseaux de similarité de séquences / Réseaux phylogénétiques / Transfert horizontal de gènes
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 23 mars 2021 12:42
Dernière modification: 23 mars 2021 12:42
Adresse URL : http://archipel.uqam.ca/id/eprint/14069

Statistiques

Voir les statistiques sur cinq ans...