Représentation de collocations dans un réseau lexical à l'aide des fonctions lexicales et des formalismes du Web sémantique

Fernandes Da Fonseca, Alexsandro (2018). « Représentation de collocations dans un réseau lexical à l'aide des fonctions lexicales et des formalismes du Web sémantique » Thèse. Montréal (Québec, Canada), Université du Québec à Montréal, Doctorat en informatique cognitive.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (16MB)

Résumé

Les collocations posent problème à plusieurs applications liées au domaine du traitement automatique des langues, comme la traduction automatique, la recherche d'information et la génération automatique de texte. Notamment, la représentation des collocations reste un problème ouvert et peu exploité. Le formalisme des fonctions lexicales a été développé pour représenter les nombreux types de relations possibles entre les mots, comme la synonymie (voiture - automobile), l'antonymie (grand - petit) et l'hyponymie (chat - mammifère) – qui sont des relations paradigmatiques –, et des relations comme l'intensification (critique virulente) et la réalisation (purger une peine) – qui sont des relations syntagmatiques. La relation entre les constituants d'une collocation est de type syntagmatique et peut être modélisée par les fonctions lexicales du même type. Dans une relation modélisée par une fonction lexicale, on peut identifier trois parties : la fonction (comme synonymie, intensification ou réalisation), la base ou mot-clé, qui est choisie librement (les mots « critique » et « peine », dans les exemples précédents), et la valeur, qui est choisie en fonction de la base (les mots « virulente » et « purger », dans les exemples précédents) et dont le sens est normalement idiomatique. Dans ce travail de recherche, nous utilisons les formalismes du Web sémantique, dont les langages RDF et OWL, pour créer une ontologie métalinguistique appelée lexfom visant à encoder les fonctions lexicales. Cette ontologie est utilisée pour représenter les relations paradigmatiques et syntagmatiques présentes dans le Réseau lexical du français (RLF), qui est un réseau basé sur les fonctions lexicales dans un format d'ontologie informatique. Nous avons extrait du RLF environ 600 fonctions lexicales standards, dont 100 fonctions simples et 500 fonctions complexes, 46 000 relations paradigmatiques et 8 000 collocations de la langue française, puis nous les avons encodées en utilisant notre modèle lexfom. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : collocation, représentation des connaissances, ontologie, fonction lexicale, relation lexicale, Web sémantique, théorie Sens-Texte.

Type: Thèse ou essai doctoral accepté
Informations complémentaires: La thèse a été numérisée telle que transmise par l'auteur.
Directeur de thèse: Sadat, Fatiha
Mots-clés ou Sujets: Collocation / Représentation des connaissances / Fonction lexicale / Ontologies / Web sémantique / Théorie sens-texte / Traitement automatique des langues naturelles
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 15 oct. 2018 08:52
Dernière modification: 15 oct. 2018 08:52
Adresse URL : http://archipel.uqam.ca/id/eprint/11719

Statistiques

Voir les statistiques sur cinq ans...