La traduction automatique au service de la revitalisation de l'innu-aimun : une approche collaborative pour développer des outils d'assistance

Cadotte, Antoine (2023). « La traduction automatique au service de la revitalisation de l'innu-aimun : une approche collaborative pour développer des outils d'assistance » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (9MB)

Résumé

L’innu-aimun est une langue autochtone membre de la famille algonquienne, présente dans une douzaine de communautés au Québec et au Labrador. L’une des plus parlées au Canada, son nombre de locuteurs est néanmoins en diminution, dans un contexte de minorisation face au français principalement. Vu les défis de transmission de la langue, et le manque de services et de communications dans celle-ci, nous proposons le développement d’outils d’assistance à l’apprentissage et à la traduction. Si des outils informatisés de base existent pour l’innu-aimun, aucun outil n’utilise actuellement de techniques plus avancées de traitement automatique du langage (TAL). Pourtant, notamment en raison d’une riche culture littéraire innue, plusieurs textes bilingues sont disponibles. Nous postulons ainsi qu’il est peut-être possible de développer la traduction automatique pour la langue, dans le cadre du développement d’outils d’assistance. Pour apporter une réelle utilité et être respectueux des communautés innues, un tel développement doit s’effectuer en collaboration avec elles. Notre première contribution est donc la conception, en collaboration avec une école primaire-secondaire innue, d’une méthode de recherche collaborative et participative en milieu éducatif autochtone. Cette approche que nous suivons se résume à l’arrimage des besoins de la recherche TAL et informatique à ceux de la communauté avec laquelle nous collaborons, ainsi que l’identification de bénéfices immédiats pour cette dernière. Dans notre cas, nous mettons cette approche à l’œuvre en élaborant deux activités, collaborative et participative, pour la collecte et la validation de textes bilingues alignés en innu-aimun et français. L’une se fait en collaboration avec le personnel enseignant de l’école primaire-secondaire innue et l’autre avec la participation d’étudiants en traduction d’innu-aimun au Cégep. Dans les deux cas, nous adaptons notre approche au contexte et au milieu, pour que la recherche soit faite par et pour les membres de la communauté, tout en s’assurant que ceux-ci bénéficient immédiatement de cette collaboration. La seconde contribution est une étude comparative des méthodes d’alignement automatique de phrases pour l’innu-aimun et le français. Se basant sur les textes bilingues que nous avons pu aligner de manière collaborative et participative avec des personnes maîtrisant la langue, nous évaluons la performance de différentes méthodes d’alignement existantes. Cette étude a pour but de déterminer quelles sont les méthodes les plus utiles pour aligner les textes bilingues qui ne sont pas alignés phrase à phrase, dans une optique de développement de la traduction automatique ou d’autres outils TAL multilingues. Elle nous permet aussi de tester les limites des méthodes d’alignement et de constituer une étude de cas pour d’autres langues qui seraient dans un contexte de faible quantité de données comme celui qu’est le nôtre. La troisième contribution est une étude de faisabilité pour la traduction automatique d’innu-aimun. Nous cherchons à savoir quelles performances de traduction sont atteignables avec les données bilingues actuellement disponibles pour la langue en utilisant les meilleures méthodes à ce jour. Ce faisant, nous obtenons les tous premiers résultats connus de traduction automatique neuronale et statistique pour l’innu-aimun. Nous procédons par ailleurs à des comparaisons des deux méthodes testées et en analysons les résultats au regard de l’apport des différents textes utilisés, à savoir des textes littéraires et poétiques innus. Dans une comparaison de significativité statistique, nous déterminons que la meilleure des deux méthodes, avec la taille et le types de textes que nous utilisons, est la traduction statistique. Grâce à ces tests, nous pouvons aussi identifier les avenues les plus prometteuses pour les améliorations des performances de traduction. Globalement, notre étude nous permet de conclure qu’un modèle de traduction automatique assez performant pour une utilisation immédiate n’est pas actuellement atteignable. Toutefois, la qualité des résultats obtenus avec aussi peu de texte et les améliorations que nous parvenons à tirer de nos expérimentations nous permettent de croire qu’un tel développement serait possible à moyen terme, et ce dans le respect des meilleures pratiques et des protocoles de recherche autochtone. À court terme, nous croyons qu’il serait possible de mettre à contribution les modèles que nous avons créés dans des systèmes de recherche interlingue où les usagers n’utiliseraient la traduction automatique qu’indirectement. Nous concluons sur des perspectives pour les prochaines étapes dans le développement collaboratif d’outils d’assistance à l’apprentissage et à la traduction de l’innu-aimun, un projet plus large dans lequel s’inscrit notre mémoire. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : traduction automatique, traitement automatique du langage, linguistique computationelle, alignement de phrases, apprentissage automatique, intelligence artificielle, corpus, langues autochtones, innu-aimun, collaboration

Type: Mémoire accepté
Informations complémentaires: Fichier numérique reçu et enrichi en format PDF/A.
Directeur de thèse: Sadat, Fatiha
Mots-clés ou Sujets: Innu-aimun (Langue) / Traduction automatique / Traduction en français / Alignement de mots / Traitement automatique des langues naturelles
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 29 janv. 2024 11:40
Dernière modification: 29 janv. 2024 11:40
Adresse URL : http://archipel.uqam.ca/id/eprint/17330

Statistiques

Voir les statistiques sur cinq ans...