Optimisation de l'ordonnancement des travaux MapReduce sur des machines parallèles et distribuées
Aymen Jlassi (IUT de Blois - LI Tours)
September 21, 2016
Les outils de gestion de gros volumes de données sont connus pour leur capacité à exécuter un grand nombre de travaux sur des volumes de données énormes (de l’ordre de plusieurs Pétaoc- tets). De ce fait, ces outils utilisent de grandes infrastructures capables de fournir la puissance de calcul demandée de manière à effectuer les traitements dans un temps raisonnable.
Dans ce papier, on s’intéresse à l’amélioration des performances du logiciel "Hadoop", le logiciel libre de référence dans l’univers des logiciels de traitement de gros volumes de données. Dans une première partie, on modélise le problème d’ordonnancement à l’aide de la programmation linéaire, on évalue le modèle et on calcule ainsi une borne inférieure pour la version hors ligne du problème. On propose une heuristique et on évalue la solution qu’on propose sur des instances de taille moyenne. Dans une deuxième partie, on évalue l'heuristique en mode en ligne et sur des grandes instances.
Date: 21 September 2016
Lieu: Département Informatique Polytech Tours.64 Avenue Jean Portalis, 37200 Tours
Salle: 110
Salle: 110