Abbasigaravand, Mahtab
(2020).
« Sentiment analysis of cultural product reviews » Mémoire.
Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.
Fichier(s) associé(s) à ce document :
Résumé
Avec la croissance rapide des médias sociaux, une très grande quantité de données est générée. Ces données contiennent des informations utiles qui peuvent être utilisées par les organisations et les gouvernements pour prendre des décisions ou faire des prévisions ou pour des raisons d’assurance qualité. Une approche automatisée est nécessaire pour extraire des informations des données non structurées. C’est la tâche de l’exploration des données. Plus précisément, l’analyse des sentiments, en tant que sous-domaine de l’exploration des donnes, se concentre sur l’extraction d’opinions à partir du texte en langage naturel. L’analyse du sentiment des produits culturels a ses propres défis et c’est l’un des domaines les plus difficiles pour effectuer une analyse du sentiment. En effet, les gens n’expriment généralement pas directement leurs sentiments et les figures de style comme le sarcasme, l’ambiguïté du langage, les allégories, abondant. Cette thèse a pour but d’effectuer une analyse de sentiments dans le cadre des revues des produits culturels. Deux approches sont étudiées pour réaliser cette tâche. La première est l’approche basée sur le lexique en utilisant POS, les adjectifs sont séparés et recherchés dans les sacs de lexique des sentiments négatifs et de lexique des sentiments positifs pour trouver à quelle catégorie ils appartiennent. Dans l’approche basée sur l’apprentissage machine, Weka est utilisé pour trouver la combinaison de prétraitement des données et d’algorithmes d’apprentissage machine qui donne la plus grande précision. L’API de données Youtube est utilisée pour extraire les commentaires d’une vidéo YouTube. Ensuite, en utilisant l’API Weka, l’algorithme sélectionné, qui est LibSVM, a été ainsi entraîner par l’ensemble de données "IMDB movie reviews". Ensuite, le classificateur formé est utilisé pour classer le texte. Les résultats montrent que l’approche de l’apprentissage machine donne une bonne précision. Afin d’obtenir de meilleurs résultats, il est préférable d’utiliser ensemble des approches basées sur la langue et une approche d’apprentissage automatique.
_____________________________________________________________________________
MOTS-CLÉS DE L’AUTEUR : analyse des sentiments, PNL, traitement du langage naturel, API de données YouTube, Weka, extraction d’opinion, basé sur un lexique, apprentissage automatique.
Type: |
Mémoire accepté
|
Informations complémentaires: |
Fichier numérique reçu et enrichi en format PDF/A. |
Directeur de thèse: |
Mili, Hafedh |
Mots-clés ou Sujets: |
Analyse de sentiments (Intelligence artificielle) / Traitement automatique des langues naturelles / Apprentissage automatique / Critique / Culture |
Unité d'appartenance: |
Faculté des sciences > Département d'informatique |
Déposé par: |
Service des bibliothèques
|
Date de dépôt: |
28 oct. 2024 10:55 |
Dernière modification: |
28 oct. 2024 10:55 |
Adresse URL : |
http://archipel.uqam.ca/id/eprint/18139 |