Traduction automatique pour une paire de langues peu dotée

Le, Ngoc Tan (2019). « Traduction automatique pour une paire de langues peu dotée » Thèse. Montréal (Québec, Canada), Université du Québec à Montréal, Doctorat en informatique cognitive.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (3MB)

Résumé

Durant ces dernières décennies, le Traitement Automatique des Langues Naturelles (TALN) a sans nul doute fait des progrès considérables sur le plan de la diversité des outils linguistiques mis à la disposition de la communauté et celui de la qualité des résultats obtenus. Néanmoins, ces progrès sont, jusqu'à une date récente, restés limités à un nombre relativement restreint de langues, majoritairement occidentales. Les langues peu dotées, ou langues-pi, langues moins bien informatisées que les grandes langues véhiculaires (l'anglais, l'espagnol, le français, etc.), souffrent du manque de ressources linguistiques dont les corpus parallèles, ressources importantes pour le développement de systèmes de TALN, notamment les systèmes de traduction automatique, et ainsi présentent plusieurs défis dans le domaine du TALN. Ce projet de recherche se concentre sur la paire de langues peu dotée français-vietnamien afin de développer un système de traduction automatique performant tout en se focalisant sur la reconnaissance des entités nommées et leurs translittérations. En premier, une analyse théorique, du point de vue cognitif, est abordée sous l'angle des théories de la linguistique et de la traduction. Par la suite, du point de vue informatique, l'objectif principal de notre projet de recherche consiste à proposer une méthode originale et fiable ainsi que des solutions aux problèmes rencontrés lors de la traduction automatique des entités nommées. Aussi, nous déterminons les sous-objectifs de ce projet de recherche, dont la reconnaissance des entités nommées pour la langue vietnamien et également la tâche de la translittération des entités nommées bilingues pour la paire de langues français-vietnamien. En plus des approches statistiques, nous adaptons l'approche d'apprentissage profond (en anglais, deep learning) au sein de nos différents systèmes afin d'améliorer davantage la qualité et l'efficacité de la traduction automatique des entités nommées. Les contributions à la traduction automatique et à la translittération automatique des entités nommées bilingues ont permis non seulement de réduire le taux des mots hors vocabulaires, mots non traduits et/ou incorrectement traduits, mais aussi d'améliorer la qualité du système de la traduction automatique. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Traduction automatique, corpus bilingue, paire de langues peu dotée, français-vietnamien, entités nommées, reconnaissance des entités nommées, translittération.

Type: Thèse ou essai doctoral accepté ()
Informations complémentaires: La thèse a été numérisée tel que transmise par l'auteur.
Directeur de thèse: Sadat, Fatiha
Mots-clés ou Sujets: Traduction automatique / Translittération / Entités nommées / Vietnamien (Langue) / Français (Langue)
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 30 nov. 2020 17:46
Dernière modification: 30 nov. 2020 17:46
Adresse URL : http://archipel.uqam.ca/id/eprint/13679

Statistiques

Voir les statistiques sur cinq ans...