Extraction de flux de travaux abstraits à partir des textes : application à la bioinformatique

Halioui, Ahmed (2018). « Extraction de flux de travaux abstraits à partir des textes : application à la bioinformatique » Thèse. Montréal (Québec, Canada), Université du Québec à Montréal, Doctorat en informatique cognitive.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (24MB)

Résumé

Dans des domaines techniques comme la didactique et la bioinformatique, l'acquisition des connaissances impliquées dans le processus de résolution de problèmes du domaine est sujet à plusieurs défis liés aux outils utilisés ainsi que son domaine d'application, e.g., en analyse phylogénétique. En outre, avec le temps, la taille de données expérientielles (impliquées dans le processus de résolution) augmente de façon exponentielle avec une très grande diversité de méthodes et de modèles informatiques. Ceci rend la tâche de résolution de plus en plus complexe à automatiser. Nous trouvons plusieurs solutions en ligne fournissant des pipelines d'analyses semi-automatiques comme dans Phylogeny.fr ou Bioextract.org mais aucune d'elles ne définit de "meilleures pratiques génériques" basées sur les types de données utilisés et les contraintes d'applications (logiciels). Dans ce manuscrit, nous proposons un système de fouille de motifs processuels fréquents basé sur une ontologie du domaine représentant différents niveaux d'abstractions du "savoir faire" dans la littérature phylogénétique (soir par exemple des textes scientifiques). La tâche d'extraction des connaissances processuelles et la désambiguïsation contextuelle ainsi que la tâche de fouille de motifs abstraits serviront par la suite à définir une base de règles de meilleures pratiques d'analyses phylogénétiques. L'utilisation de cette base de données dans un système de recommandation assistera les chercheurs du domaine dans leurs tâches de résolution de problèmes via des flux de travaux en tenant compte leurs niveaux d'expertises. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : bioinformatique, phylogénétique, flux de travaux, ontologies, extraction d'information, désambiguïsation, fouille de motifs généralisés.

Type: Thèse ou essai doctoral accepté
Informations complémentaires: La thèse a été numérisée telle que transmise par l'auteur.
Directeur de thèse: Diallo, Abdoulaye Baniré
Mots-clés ou Sujets: Flux de travaux / Bio-informatique / Phylogénétique / Ontologies / Exploration de données / Désambiguïsation lexicale / Apprentissage automatique
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 04 juin 2018 09:30
Dernière modification: 04 juin 2018 09:30
Adresse URL : http://archipel.uqam.ca/id/eprint/11331

Statistiques

Voir les statistiques sur cinq ans...