Une approche scalable du clustering des sous-espaces dans un contexte d'apprentissage profond

Sami, Sihem (2022). « Une approche scalable du clustering des sous-espaces dans un contexte d'apprentissage profond » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (2MB)

Résumé

Les méthodes de clustering des sous-espaces vectoriels (Subspace Clustering) basées sur la propriété d’autoreprésentation sont efficaces et ont connu un grand succès. Cependant, les deux étapes du subspace clustering, à savoir, la construction de la matrice d’affinité et le clustering spectral, souffrent d’une complexité temporelle et spatiale élevée, ce qui rend difficile le regroupement de grands ensembles de données. De ce fait, des chercheurs se sont intéressés à la scalabilité du subspace clustering en essayant de réduire cette complexité. Bien que de nouvelles techniques ont été proposées, ces techniques souffrent des problèmes suivants : (1) le coût de calcul reste élevé, car elles sont résolues avec une manière d’optimisation itérative, (2) certaines se basent sur des hypothèses trop restrictives, (3) la complexité peut être réduite au détriment de la précision du clustering, (4) ces techniques se concentrent que sur le clustering des sous-espaces linéaires (les données ne sont pas forcément représentées à partir de sous-espaces linéaires). Récemment, d’autres recherches se sont intéressées aux réseaux de neurones profonds pour le subspace clustering. Les recherches les plus récentes utilisent les auto-encodeurs (AEs) en introduisant une nouvelle couche d’autoreprésentation (self-expression) entre l’encodeur et le décodeur afin d’imiter la propriété d’autoreprésentation. Toutefois, nous avons remarqué qu’il n’y avait pas de travaux traitant la scalabilité du subspace clustering dans le contexte de l’apprentissage profond. Pour palier aux limites des approches existantes, nous présentons dans le cadre de ce mémoire une nouvelle approche scalable du subspace clustering profond. L’approche proposée utilise une couche d’autoreprésentation entre l’encodeur et le décodeur pour apprendre une matrice plus petite, en se basant sur des points de repère, pour construire la matrice d’affinité. Notre solution permet de réduire la complexité relative à la construction de la matrice d’affinité et à celle du clustering spectral de O(n3) vers une complexité linéaire O(n). L’efficacité de l’approche proposée est comparée à d’autres méthodes récentes sur différents ensembles de données. Les résultats des expérimentations montrent une amélioration significative de la précision du clustering par rapport aux solutions scalables existantes, et confirment la capacité de notre approche à identifier effectivement les sous-espaces. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Subspace clustering profond, Couche d’autoreprésentation (self-expression), Points de repère.

Type: Mémoire accepté
Informations complémentaires: Fichier numérique reçu et enrichi en format PDF/A.
Directeur de thèse: Bouguessa, Mohamed
Mots-clés ou Sujets: Clustering de sous-espaces / Partitionnement de données / Apprentissage profond / Extensibilité
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 30 nov. 2023 11:41
Dernière modification: 14 févr. 2024 13:47
Adresse URL : http://archipel.uqam.ca/id/eprint/17192

Statistiques

Voir les statistiques sur cinq ans...