Application des fonctions d'influence en traitement automatique du langage

Rancourt, Fanny (2024). « Application des fonctions d'influence en traitement automatique du langage » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (1MB)

Résumé

Les récents progrès en traitement automatique du langage naturel (TALN) auront permis à cette technologie de se répandre dans de nombreux domaines d’application tels que la traduction automatique et l’automatisation de processus organisationnels. Toutefois, cette adoption demande des clarifications quant à la responsabilité ainsi que la fiabilité des systèmes fondés sur l’intelligence artificielle (IA) afin que ces derniers soient dignes de confiance. Pour s’attaquer à ces enjeux, plusieurs organisations telles que le Parlement européen et le National Institute of Standards and Technology (NIST) préconisent l’analyse de ces systèmes à l’aide des principes pour une IA digne de confiance, tels la responsabilité, la transparence et l’explicabilité, puis la robustesse, la sécurité et la sûreté. Néanmoins, l’opérationnalisation de ces principes et les exigences associées sont extrêmement difficiles à formuler. C’est particulièrement le cas pour l’explicabilité, la capacité d’expliquer le comportement d’un système fondé sur l’IA à un humain. L’IA étant une technologie guidée par les données, identifier les observations influençant une prédiction est l’une des principales approches en explicabilité. Ceci peut notamment être fait à l’aide des fonctions d’influence (FI), une technique issue des statistiques robustes. Ce mémoire présente des travaux originaux traitant de l’application des FI pour des problèmes de classification en TALN. Premièrement, on analyse comment les FI peuvent informer sur la qualité de l’annotation. Bien que de moindre qualité que les annotations par des expert.es, celles impliquant la production participative d’un large public non-spécialiste sont précieuses, particulièrement lorsque peu de données sont disponibles. De plus, l’IA générative, qui peut produire des textes en langage naturel, permet de classifier ainsi que de justifier la prédiction. Toutefois, nos expériences ont révélé des limites importantes quant aux justifications lorsqu’on considère des architectures de moindres tailles. Notamment, les justifications textuelles non structurées tendent à suivre certains gabarits, même si ces derniers sont peu présents dans les données. Bien qu’il est intuitif que ces quelques exemples utilisant ces gabarits soit influents, les FI n’abondent pas en ce sens. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : fonctions d’influence, explication post-hoc, explicabilité, interprétabilité, traitement automatique du langage naturel.

Type: Mémoire accepté
Informations complémentaires: Fichier numérique reçu et enrichi en format PDF/A.
Directeur de thèse: Meurs, Marie-Jean
Mots-clés ou Sujets: Traitement automatique des langues naturelles / Fonctions d'influence / Explicabilité / Annotations / Explication
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 06 févr. 2024 15:29
Dernière modification: 06 févr. 2024 15:29
Adresse URL : http://archipel.uqam.ca/id/eprint/17361

Statistiques

Voir les statistiques sur cinq ans...