Extraction d'entités nommées par apprentissage profond

Amirat, Yacine (2020). « Extraction d'entités nommées par apprentissage profond » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (2MB)

Résumé

L’extraction des entités nommées consiste à détecter dans un texte les noms propres et les classifier dans des catégories, ou sous catégories prédéfinies telles que : nom de personne, lieu, adresse, etc. La tâche de la reconnaissance des entités nommées est souvent utilisée comme une étape de prétraitement dans d’autres applications de traitement automatique du langage naturel telles que la traduction automatique, la recherche d’information, la création d’agent conversationnel ou autres. Récemment, l’apprentissage profond a été appliqué dans le domaine de la reconnaissance des entités nommées, montrant des résultats prometteurs. Principalement, les modèles de reconnaissance des entités nommées, basés sur l’apprentissage profond avec les réseaux de neurones récurrents, reposent sur la concaténation de différents types de représentations de mots. Ces représentations doivent contenir des caractéristiques discriminantes qui permettent la détection des entités nommées. Cependant, l’indisponibilité ou le manque d’information dans certaines de ces représentations nuit à la performance du modèle. De plus, ces modèles souffrent parfois de la dégradation de performance due au problème de disparition de gradient. Dans le cadre de ce mémoire, nous visons à améliorer la performance des modèles de reconnaissance des entités nommées basés sur les réseaux de neurones récurrents. Nous proposons dans une première tentative pour remédier au problème de l’indisponibilité de représentations de mots par une somme pondérée entre deux différents types de représentations de mots. Deuxièmement, afin de diminuer l’effet de dégradation de performance connu dans les réseaux de neurones profonds, nous avons appliqué, dans un deuxième modèle, une connexion par saut inspirée du modèle ResNET (He et al., 2015). À la fin, nous proposons dans un troisième modèle, une technique pour l’extraction de caractéristiques de mots à partir de leurs caractères. Cette technique est une combinaison de deux autres techniques (CNN (LeCun et al., 1989), LSTM (Hochreiter et Schmidhuber, 1997)) utilisées dans la littérature. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : entités nommées, apprentissage profond, réseaux de neurones récurrents, extraction d’information, traitement automatique du langage naturel.

Type: Mémoire accepté
Informations complémentaires: Fichier numérique reçu et enrichi en format PDF / A.
Directeur de thèse: Salah, Aziz
Mots-clés ou Sujets: Reconnaissance de entités nommées / Apprentissage profond / Réseaux de neurones récurrents / Exploration de données / Traitement automatique des langues naturelles
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 22 mars 2021 13:16
Dernière modification: 04 oct. 2021 13:49
Adresse URL : http://archipel.uqam.ca/id/eprint/14076

Statistiques

Voir les statistiques sur cinq ans...