Disponibilité des données dans les centres de données à caractéristiques hétérogènes

Dieye, Mouhamad (2016). « Disponibilité des données dans les centres de données à caractéristiques hétérogènes » Mémoire. Montréal (Québec, Canada), Université du Québec à Montréal, Maîtrise en informatique.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (7MB)

Résumé

Les services de stockage infonuagique (cloud storage) sont devenus, à l'ère du Big Data, le choix standard en matière de stockage de données notamment grâce à leur rentabilité ainsi qu'à l'apparente capacité de stockage illimité qu'ils offrent. En raison du succès, toujours aussi croissant de ces services, les fournisseurs de stockage infonuagique sont de plus en plus incités à améliorer davantage leurs infrastructures de stockage afin de garantir des conditions strictes de disponibilité ainsi qu'un temps de réponse adéquat suite à des requêtes d'accès aux données stockées. D'autant plus que des études récentes ont globalement estimé le coût associé à l'arrêt d'applications critiques d'entreprise (critical business applications) entre $84,000 et $108,000 par heure. En dépit de nombreux efforts visant à préserver la disponibilité des données dans les systèmes de stockage infonuagique, les solutions existantes ont souvent tendance à négliger l'aspect hétérogène de l'infrastructure de stockage sous-jacente en termes de capacité, vitesse d'E/S, taux de pannes, etc. Naturellement, nous nous posons la question à savoir : quel est l'impact de l'hétérogénéité sur la capacité d'un fournisseur de stockage infonuagique à satisfaire les exigences en termes de disponibilité? Et le cas échéant, quelle stratégie de gestion de données devrait être adoptée pour faire face au défi qu'apporte l'hétérogénéité dans l'accommodement des contraintes en termes de disponibilité? Ainsi, dans ce mémoire, nous présentons une plateforme de gestion de données qui prend en considération différents paramètres des disques durs ayant une influence sur la satisfaction de Garantie de Niveau de Service (Service Level Agreement - SLA) en termes de temps d'accès et de disponibilité des données tout en garantissant une surcharge (overhead) minime en termes de stockage, de migration de données et de consommation d'énergie. Nous nommons ce nouveau mécanisme de gestion de réplicas de données, Heron. Il se base sur un algorithme génétique auquel nous combinons des techniques de prévision de la demande et des pannes de disque durs pour ajuster, de manière autonome, le nombre et l'emplacement des réplicas de données de sorte à garantir la disponibilité des données tout en tenant compte des fluctuations de performance dues à l'hétérogénéité des équipements de stockage et du trafic. À travers des simulations réalistes, nous constatons qu'Heron, suivant plusieurs scénarios de simulation et en comparaison à d'autres solutions ne tenant pas compte de l'hétérogénéité, présente en moyenne une différence de 4% pour le taux de violation en termes de disponibilité et de temps de réponse. En outre, Heron réduit considérablement la quantité de réplicas créés et migrés au fil du temps ainsi que l'énergie totale consommée. Enfin, nous montrons également qu'Heron induit une pénalité globale significativement moindre, suite aux violations en termes de disponibilité. ______________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : Systèmes de stockage infonuagiques, disponibilité des données, tolérance aux pannes, algorithmes génétiques

Type: Mémoire accepté
Informations complémentaires: Le mémoire a été numérisé tel que transmis par l'auteur.
Directeur de thèse: Elbiaze, Halima
Mots-clés ou Sujets: Banques de données / Infonuagique / Disponibilité des données / Tolérance aux fautes / Algorithmes génétiques
Unité d'appartenance: Faculté des sciences > Département d'informatique
Déposé par: Service des bibliothèques
Date de dépôt: 11 oct. 2017 11:05
Dernière modification: 11 oct. 2017 11:05
Adresse URL : http://archipel.uqam.ca/id/eprint/10487

Statistiques

Voir les statistiques sur cinq ans...