Amélioration de l’équité par des approches de prétraitement adversérielles

Ngueveu, Rosin Claude (2023). « Amélioration de l’équité par des approches de prétraitement adversérielles » Thèse. Montréal (Québec, Canada), Université du Québec à Montréal, Doctorat en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (5MB)

Résumé

L’apprentissage automatique est un domaine de recherche en pleine expansion, dont les applications sont nombreuses et impactent de nombreux aspects de notre vie. Par exemple, des modèles d’apprentissage sont déployés dans nos téléphones intelligents ou encore dans des systèmes d’aide à la décision dans le domaine financier ou juridique. Bien que ces outils aient un succès important et peuvent améliorer la qualité de vie, ils ne sont pas exempts de défauts. Ainsi, ces systèmes peuvent agir comme des miroirs et reproduire des biais sociétaux qu’ils ont appris, voir même les amplifier de manière systématique. Afin de pallier ces problèmes, de nombreuses recherches ont été menées ces dernières années pour obtenir des systèmes capables d’apprendre automatiquement tout en faisant abstraction des biais non désirables qui pourraient exister dans les données. Dans cette thèse, nous décrivons dans un premier temps les sources potentielles de biais. Nous explorons ensuite les méthodes et les mécanismes de quantification de la discrimination existant dans la littérature, et nous présentons quelques approches permettant de remédier aux biais dans l’apprentissage automatique. En plus de ces contributions, nous introduisons une catégorisation des méthodes d’amélioration de l’équité afin d’identifier les différents challenges et opportunités dans ce domaine. Dans notre deuxième recherche, nous proposons l’approche d’amélioration de l’équité, GANSan, basée sur des systèmes de modélisation de distributions tels que les réseaux adversériaux génératifs. Nous conduisons une analyse étendue de l’impact de notre approche au travers de divers scénarii potentiels. Nous analysons ensuite les comportements de GANSan afin de comprendre différents phénomènes que nous avons pu observer, tels que l’amélioration des performances de prédiction d’une tâche. Ces analyses nous permettent d’établir les limites de notre approche dans la protection d’informations sensibles, ainsi que de montrer et d’expliquer le phénomène d’alignement des distributions. Inspirée de notre deuxième chapitre, notre troisième chapitre propose l’approche DYSAN, qui est une amélioration de GANSan appliquée dans le contexte médical, particulièrement dans le domaine du soi quantifié. Cette nouvelle approche est personnalisable aux données des personnes, affiche des performances supérieures à l’état de l’art sur plusieurs jeux de données contenant des signaux de capteurs, et impacte légèrement l’autonomie de l’appareil sur lequel il est déployé. Ainsi, les utilisateurs peuvent partager leurs données tout en préservant leurs informations sensibles. Enfin, notre dernière contribution majeure consiste en notre approche FairMapping, dont le but est de transférer les propriétés d’un premier groupe à un second, pour faire profiter au second les privilèges du premier, et pour mitiger les effets de la discrimination. Notre approche met en oeuvre le transport optimal pour transformer les données. FairMapping maintient l’aspect réaliste des données, réduit les risques de discrimination par la protection de l’attribut sensible, facilite l’interprétation et l’utilisation des données transformées dans des situations critiques et limite les modifications à faire sur un environnement existant pour utiliser les données modifiées. Les expériences réalisées sur deux ensembles de données permettent de valider nos hypothèses.

Type: Thèse ou essai doctoral accepté
Informations complémentaires: Fichier numérique reçu et enrichi en format PDF/A.
Directeur de thèse: Gambs, Sébastien
Mots-clés ou Sujets: Apprentissage automatique / Équité / Discrimination / Biais algorithmiques / Confidentialité des données / Intelligence artificielle -- Éthique
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 17 juill. 2023 13:39
Dernière modification: 18 juill. 2023 08:59
Adresse URL : http://archipel.uqam.ca/id/eprint/16761

Statistiques

Voir les statistiques sur cinq ans...