Chaînes de traitement pour la détection de concepts dans le contexte de l'analyse conceptuelle philosophique basée sur des données textuelles

Chartrand, Louis (2019). « Chaînes de traitement pour la détection de concepts dans le contexte de l'analyse conceptuelle philosophique basée sur des données textuelles » Thèse. Montréal (Québec, Canada), Université du Québec à Montréal, Doctorat en informatique cognitive.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (4MB)

Résumé

Dans les dernières années, l'analyse conceptuelle en philosophie a pris un tournant empirique, notamment avec l'essor de la philosophie expérimentale et, plus localement, de la Lecture et analyse conceptuelle de texte assistée par ordinateur (LACTAO), ouvrant ici la porte au développement d'un type d'analyse conceptuelle basée sur l'étude des corpus de données textuelles. Cependant, certains défis techniques viennent encore freiner l'essor de ce type de méthode. En particulier, l'heuristique couramment employée pour détecter la présence d'un concept dans le texte, l'heuristique du mot-clé, tend à exclure systématiquement certains contextes où le concept est employé implicitement, et à inclure des contextes où le ou les mots que l'on associe habituellement à un concept sont employés dans un sens très différent. La présente thèse attaque ce problème en deux étapes, qui sont présentées dans trois articles. Dans une première étape, on discute les notions principales de cette question - ANALYSE CONCEPTUELLE et CONCEPT - afin d'interpréter le problème de la détection de la présence du concept dans le texte. Un portrait du type d'analyse conceptuelle philosophique susceptible de prendre en compte des données empiriques est avancé, et sur la base de celui-ci, on énonce un problème pour le concept de CONCEPT. Une solution est alors proposée en puisant dans la téléosémantique de Millikan ( 1984), et on montre comment son application permet à la fois de faire un protocole d'annotation pour la détection de la présence du concept dans le texte, et de proposer des avenues d'automatisation pour la même tâche. Dans une deuxième étape, des chaînes de traitement exploitant des modèles topiques sont conçues et sont évaluées. Pour l'évaluation de celles-ci, un protocole d'annotation est conçu et soumis à des participant-es. Deux ensembles de chaînes de traitement sont ensuite testées, l'un reposant sur l'allocation de Dirichlet latente (LDA) de Blei et al. (2003) et l'autre reposant sur le Latent Concept Topic Model de Hu et Tsujii (2016). Les résultats des chaînes de traitement des deux ensembles s'avèrent mieux corrélées avec les jugements humains que l'heuristique du mot-clé, mais les meilleurs résultats viennent de chaînes construites à partir de la LCTM, dont certaines sont également plus flexibles dans la formulation du concept ciblé qu'elles permettent. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : philosophie expérimentale, analyse conceptuelle, LACTAO, modèle topique, enrobages de mots, sémantique distributionnelle

Type: Thèse ou essai doctoral accepté
Informations complémentaires: La thèse a été numérisée telle que transmise par l'auteur.
Directeur de thèse: Meunier, Jean-Guy
Mots-clés ou Sujets: Analyse conceptuelle / Concepts / Philosophie expérimentale / Modélisation topique / Analyse de données textuelles / Lecture et analyse conceptuelle de texte assistée par ordinateur (LACTAO)
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 08 juill. 2020 14:07
Dernière modification: 14 juill. 2020 10:15
Adresse URL : http://archipel.uqam.ca/id/eprint/13386

Statistiques

Voir les statistiques sur cinq ans...