110 likes | 239 Vues
Sous-projet IV Communications Placement/Ordonnancement. SP 4 : participants. George Bosilca (doctorant) Franck Cappello (CR CRNS) Adberhamanne Djilali (doctorant) Gilles Fedak (doctorant) Cecile Germain (MC Univ. PXI) Oleg Lodygensky (Ing. Doctorant) Vincent Néri (IE)
E N D
SP 4 : participants • George Bosilca (doctorant) • Franck Cappello (CR CRNS) • Adberhamanne Djilali (doctorant) • Gilles Fedak (doctorant) • Cecile Germain (MC Univ. PXI) • Oleg Lodygensky (Ing. Doctorant) • Vincent Néri (IE) • Anton Selikov (PostDoc) + • Henri Casanova (UCSD – USA) ACI GRID CGP2P 30/01/02
SP 4 : objectifs généraux • Exécution d'applications parallèles • Placement/ordonnancement • d'applications non-communicantes • d'applications parallèles • Sur CGP2P : CG/P2P-interactions/P2P-système ACI GRID CGP2P 30/01/02
Execution parallèle Lancement Disparition Re-lancement • Vrai parallélisme massif : K machines • Modèles d'exécution • Graphe de tâches -> SP1 • Passage de messages • L'exécution doit progresser en présence de défaillances massives :tolérance aux pannes complètement décentralisée ACI GRID CGP2P 30/01/02
Parallélisme et tolérance aux fautes Choix : Virtualisation des tâches logiques permanentes sur des tâches volatiles • Flots d'exécution, ex processus MPI • Communications, ex send/recv MPI • Infrastructure logicielle • Communication • Sauvegarde (checkpoint) • Lancement • Protocoles • Quoi/Quand • Sauvegarder/Reprendre • Correction SP 5 • Optimisation Mouvement de données Ordonnancement ACI GRID CGP2P 30/01/02
Une implémentation de MPICH Fondée sur des communications découplées Canal mémoire Service distribué Extensibilité d'un service chargé Construire un modèle de performances Protocoles Expérimentation Communications : MPICH-V W W Send/Recv Espace de tuples put get ACI GRID CGP2P 30/01/02
Sauvegardes (checkpoint) • Infrastructure logicielle de sauvegarde locale : libckpt ? + contexte • Ordonnancement local • Fiabilité du support et importance de la tâche • Placement global tâches/sauvegardes • Consommation de ressources réseau • Service de stockage -> SP2 ACI GRID CGP2P 30/01/02
Placement/Ordonnancement • Que reste-t-il du Processeur/Date dans un système CG/P2P • Echelle massive • Volatilité des ressources • Faible contrôle • Information très incomplète • Faible bande passante ACI GRID CGP2P 30/01/02
Les différentes approches • Algorithmique centralisée adaptative • Algorithmique décentralisée : vol/donation de travail, diffusion… • Applicatif : ne dépend que du graphe Objectif : degré de réplication commecompromis débit global du système et temps de complétion (makespan) d ’une application ACI GRID CGP2P 30/01/02
Les ressources La définition des ressources ne peut être basée que sur une inférence statistique • Les environnements • Collection de traces : Ganglia, NWS, XWTrace • Prédiction de disponibilité /performance : NWS • Les questions scientifiques • Qualité de la prédiction • Sensibilité des algorithmes de scheduling à la QoI ACI GRID CGP2P 30/01/02
Plan de travail Etude comms Proto Comms Evaluation Micro-bench Etude protocoles de reprise Proto MPICH-V Evaluation Benchmarks NAS, Linpack Outils de traces et d'analyse stat. Testbed Etude ordonnancement Proto Evaluation t0+6 t0+12 t0+18 t0+24 t0+30 t0+36 t0 ACI GRID CGP2P 30/01/02