Abdous, Kamel
(2025).
« Contributions to multiplex graph modeling : handling high-dimensionality, addressing curved manifolds, and tackling heterophily » Thèse.
Montréal (Québec), Université du Québec à Montréal, Doctorat en informatique.
Fichier(s) associé(s) à ce document :
Résumé
Ces dernières années ont vu l’émergence de systèmes complexes où les entités sont connectées par plusieurs types d’interactions (c.-à-d., des dimensions). Dans ce contexte, les graphes multiplex ont gagné en popularité pour représenter la structure interdépendante de ces systèmes. Les graphes multiplex sont caractérisés par leur multidimensionnalité, ce qui signifie que la connectivité des noeuds diffère d’une dimension à l’autre. Ainsi, la modélisation des graphes multiplex vise à découvrir des relations complexes entre diverses dimensions afin d’extraire des informations pertinentes sur les noeuds et leurs interactions multidimensionnelles. Dans cette thèse, nous formulons trois défis fondamentaux qui affectent les modèles existant pour les graphes multiplex et proposons des méthodes et techniques qui s’appuient sur des considérations théoriques solides pour les surmonter. Premièrement, nous mettons en évidence que la haute dimensionnalité des graphes multiplex impacte négativement la performance des méthodes existantes. Deuxièmement, nous observons que les espaces latents produits par les modèles de graphes multiplex existants sont souvent fortement courbés. Troisièmement, nous constatons que le phénomène de l’hétérophilie, qui peut apparaître dans certaines dimensions des graphes multiplex, a été jusqu’à présent négligé. Dans le premier chapitre, nous étudions le problème de la représentation des graphes multiplex de haute dimension et nous proposons HMGE (Hierarchical Multiplex Graph Embedding), une méthode d’apprentissage de représentation pour résoudre les difficultés induites par la haute dimensionnalité des graphes multiplex. HMGE utilise un mécanisme d’agrégations hiérarchiques pour réduire progressivement un nombre élevé de dimensions potentiellement divergentes en un ensemble plus compact de structures latentes informatives. Ce processus se produit de manière hiérarchique, formant une structure à multiples niveaux qui révèle des informations cachées dans les dimensions originales. En particulier, les agrégations hiérarchiques peuvent modéliser des motifs plus complexes que les approches classiques d’agrégation linéaire. De plus, nous maximisons l’information mutuelle pour capturer des informations globales présentes à divers endroits du graphe. Dans le deuxième chapitre, nous étudions le problème de la représentation des graphes multiplex d’un point de vue géométrique. Nous réalisons une étude géométrique des espaces latents extraits par les approches existantes, et identifions la présence d’espaces fortement courbés causée par des distorsions géométriques, ce qui affecte négativement l’applicabilité des représentations. Pour résoudre ce problème, nous proposons HYPERMGE (HYPERbolic Multiplex Graph Embedding), une méthode qui intègre à la fois des agrégations hiérarchiques et des réseaux de neurones hyperboliques de graphes afin de réduire la quantité des distorsions géométriques dans l’espace latent. Cette approche extrait des représentations dans des espaces linéaire et de basse dimension, facilitant leur exploitation pour des tâches d’apprentissage telles que la prédiction de liens et la classification de noeuds. Dans le troisième chapitre, nous explorons le phénomène de l’hétérophilie, jusqu’alors négligé dans la littérature sur la modélisation des graphes multiplex. Contrairement à l’homophilie, l’hétérophilie désigne la tendance des noeuds de classes différentes, et avec des attributs distincts, à être connectés. Dans les graphes multiplex, les degrés d’hétérophilie et d’homophilie peuvent varier considérablement d’une dimension à l’autre. Pour résoudre ce problème, nous introduisons HAAM (Heterophily-Aware Adaptive Multiplex model), une approche adaptative conçue pour capturer les interactions à la fois homophiliques et hétérophiliques au sein du même graphe multiplexe. Le modèle utilise des matrices de compatibilité spécifiques aux dimensions, couplées avec la composition de filtres de Chebyshev passe-bas et passe-haut, ainsi que des étiquettes de classification résultant d’une descente de gradient proximal. Cette approche constitue une première étape pour l’étude de l’hétérophilie dans les graphes multiplex. En résumé, la recherche menée dans cette thèse fait progresser le domaine de la modélisation des graphes multiplex en abordant des problèmes qui n’ont pas été pris en compte dans les études antérieures. Les méthodes et techniques développées dans ce travail apportent des améliorations expérimentales significatives sur plusieurs ensembles de données et tâches d’apprentissage. De plus, les contributions ont été publiées dans des journaux et conférences prestigieux, soulignant leur importance et leur pertinence.
_____________________________________________________________________________
MOTS-CLÉS DE L’AUTEUR : apprentissage profond, réseaux de neurones de graphes, graphes multiplex, apprentissage de représentations de graphes, réseaux de neurones hyperboliques de graphes
Type: |
Thèse ou essai doctoral accepté
|
Informations complémentaires: |
Fichier numérique reçu et enrichi en format PDF/A. |
Directeur de thèse: |
Bouguessa, Mohamed |
Mots-clés ou Sujets: |
Graphes multiplex / Réseaux de neurones sur graphes / Apprentissage de représentation des graphes / Données hautement dimensionnelles |
Unité d'appartenance: |
Faculté des sciences > Département d'informatique |
Déposé par: |
Service des bibliothèques
|
Date de dépôt: |
29 avr. 2025 10:29 |
Dernière modification: |
29 avr. 2025 10:29 |
Adresse URL : |
http://archipel.uqam.ca/id/eprint/18736 |