Improving ChatGPT’s emotional intelligence through prompt engineering

Belkhir, Ahmed (2023). « Improving ChatGPT’s emotional intelligence through prompt engineering » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (3MB)

Résumé

Ce mémoire de maîtrise présente une étude sur l’amélioration des capacités émotionnelles des modèles de langues conversationnels. Cette recherche étudie de nouvelles approches pour incorporer les émotions dans les réponses des chatbots en utilisant le prompt engineering. Ce travail est motivé par la demande croissante de chatbots émotionnellement intelligents qui peuvent engager les utilisateurs dans des conversations plus personnalisées et compatissantes. Pour ce faire, deux contributions principales sont fournies. Tout d’abord, un classificateur d’émotions précis basé sur le modèle ELECTRA est développé. Le classificateur est entraîné sur l’ensemble de données GoEmotions. Il obtient des performances impressionnantes, avec un AUROC allant jusqu’à 98,5 %. Ce classificateur d’émotions fiable sert comme élément de base pour le reste de la recherche et facilite l’analyse des émotions des utilisateurs et des chatbots. Deuxièmement, de nouvelles méthodes d’infusion d’émotions utilisant le prompt engineering sont proposées et évaluées. Les modèles de chatbot ChatGPT-B et ChatGPT-C sont conçus pour modifier leurs réponses en fonction des émotions de l’utilisateur, ce qui se traduit par des interactions plus cohérentes sur le plan émotionnel. D’une part, ChatGPT-B prend en compte l’émotion de l’utilisateur avant de générer des réponses à l’aide d’un classificateur d’émotions, et d’autre part, ChatGPT-C tente de s’adapter à ce que ressent l’utilisateur sans aucune composante externe, en s’appuyant uniquement sur l’ingénierie de l’invite pour améliorer les réponses au niveau émotionnel. En analysant les réponses des deux versions modifiées proposées et en les comparant à la version standard de ChatGPT (ChatGPT-A), nous constatons que l’utilisation du classificateur d’émotions externe entraîne une utilisation plus fréquente et plus prononcée des émotions positives par rapport à la version standard. En revanche, l’utilisation d’une simple ingénierie d’invite pour prendre en compte l’émotion de l’utilisateur produit l’effet inverse. Enfin, les comparaisons avec des modèles de chatbots émotionnels proposés dans la littérature mettent en évidence le potentiel du prompt engineering pour améliorer les capacités émotionnelles des agents conversationnels basés sur les modèles de langues larges. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Agents conversationnels, Chatbots, Modèles de langue larges, Apprentissage par transfert, Intelligence émotionnelle

Type: Mémoire accepté
Informations complémentaires: Fichier numérique reçu et enrichi en format PDF/A.
Directeur de thèse: Sadat, Fatiha
Mots-clés ou Sujets: Agents conversationnels / ChatGPT / Intelligence émotionnelle / Émotions / Rédactique / Grands modèles de langage / Apprentissage par transfert (Intelligence artificielle)
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 31 janv. 2024 14:45
Dernière modification: 31 janv. 2024 14:45
Adresse URL : http://archipel.uqam.ca/id/eprint/17338

Statistiques

Voir les statistiques sur cinq ans...