Architecture d'un service d'analyse pour CDN basé sur le Cloud : cas de prédiction de popularité

Aloui, Maroi (2020). « Architecture d'un service d'analyse pour CDN basé sur le Cloud : cas de prédiction de popularité » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (1MB)

Résumé

Ce mémoire propose une nouvelle approche servant à prédire le niveau de popularité des vidéos générées par les utilisateurs en temps réel. Cette approche se base sur une architecture d’analyse des données en tant que service couramment appelé Analytics as a Service (AaaS). La nouvelle architecture proposée utilise les services web RESTful pour rassembler les traces produites par les utilisateurs sur les réseaux de distribution de contenu (CDN : Content Delivery Network), et les stocker dans des formats génériques dans une base de données NoSQL avant d’en calculer la popularité. La collecte des traces des visualisations des vidéos (logs ) se fait à partir des CDNs basés sur l’infonuagique (Cloud). La solution choisit les caractéristiques nécessaires depuis ces (logs) pour former un modèle regroupant les vidéos en fonction de leur niveau de popularité pour ensuite envoyer une liste des vidéos les plus populaires nécessaires au CDN. La popularité d’une vidéo est calculée à l’aide d’un modèle de classification préétabli. Ce modèle est construit hors ligne à l’aide d’un algorithme de partitionnement de données (Clustering ) qui effectue l’entraînement des données récentes disponibles dans la base des données. L’architecture RESTful proposée est adaptée au fonctionnement du réseau CDN grâce à sa facilité de mise en place et de déploiement sur le web. Cette architecture utilise des techniques de paradigme des données massives (Big Data) pour traiter des millions de données. Ces données peuvent avoir différentes structures. L’algorithme de Clustering n’effectue aucune réduction de dimensions préalable, contrairement à d’autres solutions qui présélectionnent les dimensions comme la régression linéaire. Cet avantage rend la solution générique et augmente sa fiabilité en évitant les risques d’une mauvaise réduction de dimension. Nous avons évalué notre solution à l’aide d’une base de données YouTube ayant plus de 10 millions de données sur des vidéos (temps de visualisation, nombre de vues, nombre de partages de la vidéo, etc.). Notre technique d’analyse de données permet de prédire la popularité des vidéos avec une précision de 99,8 % et un temps d’exécution de moins de 2 secondes. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : CDN, Infonuagique, Web service RESTful, Algorithme de clustering

Type: Mémoire accepté
Informations complémentaires: Fichier numérique reçu et enrichi en format PDF / A.
Directeur de thèse: Elbiaze, Halima
Mots-clés ou Sujets: Vidéo en continu / Réseaux de diffusion de contenu / Infonuagique / REST (Architecture logicielle) / Services Web / Données volumineuses
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 30 mars 2021 09:29
Dernière modification: 04 oct. 2021 13:47
Adresse URL : http://archipel.uqam.ca/id/eprint/14035

Statistiques

Voir les statistiques sur cinq ans...