Lareau, Francis
(2023).
« Lecture et analyse argumentaire de texte assistés par ordinateur (LAATAO) : détection automatique d'argument dans les textes de haut niveau théorique » Thèse.
Montréal (Québec), Université du Québec à Montréal, Doctorat en informatique cognitive.
Fichier(s) associé(s) à ce document :
Résumé
Ce travail de recherche vise à appliquer les méthodes de lecture et d’analyse de texte assistées par ordinateur (LATAO) à des textes de haut niveau théorique en explorant plus particulièrement les dimensions d’assistance à la fouille d’argument (argument mining). Il vise le développement d’un système informatique dont le but est d’effectuer la tâche de détection automatique d’arguments. Dans un premier temps, nous présentons les assises théoriques d’un tel système dont, notamment, l’analyse du discours, la lecture et l’analyse de texte assistées par ordinateur, l’argumentation, les modèles computationnels de l’argumentation ainsi que leurs différentes applications. Dans un deuxième temps, nous présentons le système de fouille d’argument de manière à saisir les différents objets informatiques en jeu ainsi que les étapes opératoires comme la définition du corpus, la préparation du corpus, la détection des arguments et la représentation des résultats. Dans un troisième temps, nous explorons plus en détail l’étape de détection des composantes argumentatives et des relations à l’intérieur et entre les arguments en explicitant les différentes représentations et les divers outils informatiques permettant une telle détection. Au terme de cette exploration, une théorie novatrice de l’argumentation est présentée ainsi que diverses hypothèses de recherche à propos de composantes argumentatives importantes telles que les contextes de citation et les thèses principales. À cet effet, deux expériences sont effectuées afin de tester les hypothèses de recherche. Les résultats de la première expérience montrent que la détection automatique de l’appartenance des contextes de citation à une structure argumentative particulière est possible. La combinaison d’une représentation textuelle basée sur « text-embedding-ada-002 » sans affinage et d’un classifieur de type SVM semble donner de très bons résultats, mais l’approche la plus performante apparait être une combinaison de la représentation BERT de base affinée sur nos données et de la régression logistique avec validation croisée. Les résultats de la deuxième expérience montrent que la détection automatique de la thèse principale est possible. L’approche la plus performante pour la détection de la thèse principale apparait être un modèle ensembliste combinant une mesure de similitude entre la section « introduction » et les énoncés de la section « discussion », l’emplacement de la thèse principale dans le texte et la présence (ou non) de certains connecteurs de discours. Dans la structure du résumé, l’approche fondée sur l’emplacement s’est avérée plus performante.
_____________________________________________________________________________
MOTS-CLÉS DE L’AUTEUR : argumentation, fouille d’argument, texte de haut niveau théorique, analyse du discours, Lecture et Analyse de Texte Assistées par Ordinateur (LATAO), Lecture et Analyse Argumentaire de Texte Assistées par Ordinateur (LAATAO)
Type: |
Thèse ou essai doctoral accepté
|
Informations complémentaires: |
Fichier numérique reçu et enrichi en format PDF/A. |
Directeur de thèse: |
Meunier, Jean-Guy |
Mots-clés ou Sujets: |
Fouille de données / Argumentation / Analyse du discours / Lecture et analyse de texte assistées par ordinateur (LATAO) |
Unité d'appartenance: |
Faculté des sciences > Département d'informatique |
Déposé par: |
Service des bibliothèques
|
Date de dépôt: |
08 janv. 2025 15:02 |
Dernière modification: |
08 janv. 2025 15:02 |
Adresse URL : |
http://archipel.uqam.ca/id/eprint/18395 |