La sémiotique computationnelle entre narrativité et apprentissage automatique : une démonstration de faisabilité sur un corpus journalistique à propos du printemps érable

Pulizzotto, Davide (2019). « La sémiotique computationnelle entre narrativité et apprentissage automatique : une démonstration de faisabilité sur un corpus journalistique à propos du printemps érable » Thèse. Montréal (Québec, Canada), Université du Québec à Montréal, Doctorat en sémiologie.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (9MB)

Résumé

La révolution numérique est en train de modifier profondément les pratiques des sciences humaines et sociales. Dans ce nouveau parcours, la sémiotique joue un rôle prépondérant en raison de ses spécificités qui la rendent compatible avec le cadre computationnel requis par le numérique. La sémiotique computationnelle est un champ de recherche qui contribue au développement des humanités numériques. Mais que signifie numérique ou computationnel pour les humanités? Cette thèse présente une piste de réponse à ce genre de questionnement à l'aide d'une démonstration de faisabilité. Pour ce faire, une pratique pertinente dans ce contexte est identifiée, soit l'analyse de texte assistée par ordinateur (ATO). En effet, l'analyse de texte est l'une des pratiques les plus répandues en humanités et constitue également l'un des objets d'étude privilégiés de la sémiotique. Par la suite, un cas d'étude est identifié dans le domaine des médias et, plus particulièrement, dans le champ de l'analyse de presse. Le printemps érable, le mouvement estudiantin québécois de 2012, a été choisi en raison de sa large couverture journalistique, ce qui garantit la possibilité d'obtenir un grand nombre d'articles de presse traitant ce phénomène socio-politique. L'analyse de ce corpus journalistique a été effectuée au moyen d'une chaîne de traitement construite avec le support d'outils issus du traitement automatique du langage naturel et de l'apprentissage automatique. Pour ce faire, une approche théorique d'intersection entre la sémiotique et l'intelligence artificielle a été mise au point et ceci, afin de fournir une assistance computationnelle à une théorie sémiotique spécifique, soit la « sémiotique narrative ». Ainsi, une technique de clustering a été choisie pour assister l'analyse narrative du texte journalistique. La chaîne de traitement est évaluée par une phase d'annotation qui constitue une partie importante de la méthode. Les résultats montrent que la chaîne de traitement est pertinente pour l'exploration d'un corpus de grande taille. En effet, de grands agglomérats de macrostructures sémantiques similaires ont été identifiés de manière transversale aux différentes sources d'information. On identifie, par exemple, que le discours électoraliste est un des plus fréquents du corpus, ainsi que les débat sur les négociations entre les étudiants et le gouvernement. On identifie aussi certaines spécificités selon le journal, comme la mise en valeur du concept d'éducation par le journal Le Devoir, ou des concepts économiques par Le Journal de Montréal. Chaque résultat obtenu constitue ainsi une piste de recherche pour l'approfondissement de la couverture journalistique sur le printemps érable. Ce travail de recherche contribue au transfert de connaissance de l'informatique vers les sciences humaines et, plus particulièrement, vers la sémiotique. Le parcours de la thèse tente de faciliter la compréhension des différents algorithmes et outils de la chaîne de traitement. Elle contribue également à la compréhension d'un des volets de la sémiotique computationnelle, celui qui voit l'ordinateur comme« outils au service de l'analyse sémiotique». Elle propose aussi une perspective particulière pour l'agencement de la sémiotique et de l'intelligence artificielle et, donc, pour le développement de la sémiotique computationnelle. De façon plus spécifique, la recherche souligne la nécessité de décomposer les pratiques de la sémiotique en tâches simples et formelles, afin que leur conversion en tâches computables soit réalisée. Enfin, les humanités n'ont pas de raison de craindre la révolution numérique amenée par le développement de l'intelligence artificielle, mais elle devrait plutôt en profiter pour augmenter ses capacités d'analyse des phénomènes humains et sociaux. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : humanités numériques, sémiotique computationnelle, analyse de texte assistée par ordinateur, ATO, traitement automatique du langage naturel, apprentissage automatique, fouille de texte, text mining, analyse des données, clustering, analyse narrative, texte journalistique, analyse de presse, printemps érable, mouvement étudiant québécois de 2012

Type: Thèse ou essai doctoral accepté
Informations complémentaires: La thèse a été numérisée telle que transmise par l'auteur.
Directeur de thèse: Meunier, Jean-Guy
Mots-clés ou Sujets: Sémiotique computationnelle / Analyse du discours assistée par ordinateur / Articles (Publications) / Grève étudiante, Québec, 2012, dans les médias
Unité d'appartenance: Faculté des arts > Département d'études littéraires
Déposé par: Service des bibliothèques
Date de dépôt: 17 déc. 2020 12:09
Dernière modification: 17 déc. 2020 12:11
Adresse URL : http://archipel.uqam.ca/id/eprint/13817

Statistiques

Voir les statistiques sur cinq ans...