Sur le problème du dictionnaire inversé

Guité-Vinet, Julien (2023). « Sur le problème du dictionnaire inversé » Mémoire. Montréal (Québec), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (1MB)

Résumé

Un dictionnaire est un système de symboles qui associe des mots à d’autres mots de telle sorte que la signification des mots définis est établie à travers les mots des définitions. Le problème du dictionnaire inversé consiste à deviner un mot à partir d’une définition. Résoudre ce problème s’avère utile dans plusieurs contextes, puisque cela permet de représenter la connaissance lexicale, d’attribuer des mots-clés à un ensemble d’idées ou de dissiper l’ambiguïté sémantique autour de concepts. Des travaux récents en traitement du langage naturel proposent des modèles de type transformeur (BERT, GPT-4) qui sont entraînés sur un grand corpus de texte et qui sont ensuite réglés spécifiquement afin d’accomplir une tâche propre au domaine. Leur entraînement pose un défi parce qu’elle peut, entre autres, être coûteuse en calcul, difficile à paramétrer, et dépend de la taille et de la qualité des ensembles de données utilisés durant leur entraînement. Ce mémoire aborde les tâches et problématiques associées au traitement automatique du langage et les différents modèles et stratégies permettant de résoudre le problème du dictionnaire inversé. Nos travaux explorent de possibles usages que l’on peut faire des transformeurs dans le cadre de cette problématique. Les modèles développés sont ensuite utilisés dans le cadre d’un jeu sérieux appelé Jeu du dictionnaire. Plus globalement, les résultats obtenus pointent vers une exploration plus approfondie des modèles de langue profonds ainsi que le transfert d’apprentissage afin de résoudre d’autres types de tâches.

Type: Mémoire accepté
Informations complémentaires: Fichier numérique reçu et enrichi en format PDF/A.
Directeur de thèse: Blondin Massé, Alexandre
Mots-clés ou Sujets: Traitement automatique des langues naturelles / Transformeurs / Dictionnaires inverses / Jeu du dictionnaire
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 01 déc. 2023 16:05
Dernière modification: 01 déc. 2023 16:05
Adresse URL : http://archipel.uqam.ca/id/eprint/17196

Statistiques

Voir les statistiques sur cinq ans...