Remita, Mohamed Amine
(2017).
« Méthodes et plateformes bioinformatiques basées sur l'apprentissage automatique pour la classification efficace de séquences biologiques » Mémoire.
Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.
Fichier(s) associé(s) à ce document :
Résumé
Les récentes avancées des technologies de séquençage des biomolécules ont contribué à la génération de quantités colossales de séquences et de données biologiques. La classification de ces séquences est importante dans les différentes analyses de séquences telles que l'identification des éléments génomiques, la prédiction de leurs caractéristiques et fonctions, et l'inférence de leurs relations phylogénétiques et taxonomiques. Les méthodes de classification assignent une nouvelle séquence à un ensemble de séquences de référence qui partagent des propriétés et des traits similaires. Ces méthodes appartiennent à plusieurs catégories d'approches qui sont basées sur l'alignement de séquences ou la phylogénie, ou indépendantes de l'alignement de séquences. Plusieurs méthodes de classification sont généralement spécifiques à un type d'organisme et ne sont pas adaptées à un volume énorme de séquences. Dans ce mémoire, nous abordons deux problématiques de classification des séquences nucléotidiques, la classification des séquences virales en rangs taxonomiques et l'identification des microARNs à partir d'un lot de séquences de petits ARNs. Nous avons développé des méthodes de classification intégratives, indépendantes de l'alignement de séquences et basées sur l'apprentissage automatique. Ces nouvelles méthodes sont génériques, adaptées à plusieurs types d'organismes, et peuvent traiter des grandes quantités de données de nature hétérogène. Les méthodes développées sont efficaces, rapides et ont des performances comparables à celles des méthodes existantes. Finalement, elles sont implémentées dans des plateformes web publiques facilitant la réutilisation et la reproductibilité des expériences de classification par la communauté.
______________________________________________________________________________
MOTS-CLÉS DE L’AUTEUR : Classification des séquences nucléotidiques, apprentissage automatique, prédiction, classification des séquences virales, identification des rnicroARNs, plateformes intégratives.
Type: |
Mémoire accepté
|
Informations complémentaires: |
Le mémoire a été numérisé tel que transmis par l'auteur. |
Directeur de thèse: |
Diallo, Abdoulaye Baniré |
Mots-clés ou Sujets: |
Bio-informatique / Apprentissage automatique / Séquence nucléotidique -- Classification / Génomes viraux / MicroARN / Plateformes |
Unité d'appartenance: |
Faculté des sciences > Département d'informatique |
Déposé par: |
Service des bibliothèques
|
Date de dépôt: |
01 sept. 2017 13:41 |
Dernière modification: |
01 sept. 2017 13:41 |
Adresse URL : |
http://archipel.uqam.ca/id/eprint/9851 |