210 likes | 294 Vues
Projet grappe 200 PC. Philippe Augerat. Laboratoire ID. Statut du projet. Appel d’offre infructueux Pentium 4 Athapascan Partenariats. Applications. Philosophie : partenariats scientifiques, validation d’Athapascan Applications nouvelles : Cartographie Génomique Imagerie
E N D
Projet grappe 200 PC Philippe Augerat Laboratoire ID
Statut du projet • Appel d’offre infructueux • Pentium 4 • Athapascan • Partenariats
Applications • Philosophie : partenariats scientifiques, validation d’Athapascan • Applications nouvelles : • Cartographie • Génomique • Imagerie • Optimisation combinatoire • Travail sur les méthodes
Environnements hétérogènes • Nouvelles plateformes : • Architectures de grilles • Global computing • Couplage de code • Algorithmique : • Ordonnancement hétérogène et hiérarchique • Ordonnancement inter/intra applications
I-cluster • Centre de calcul dédié à l’expérimentation • 225 PC « entrée de gamme » sur réseau standard • Utilisation intensive dont une cinquantaine d’utilisateurs en dehors d’ID
Outils d’exploitation d’une grappe de grande taille • Mettre en place des architectures de calcul et de services basées sur des centaines (milliers) de PC • Voir (accéder, administrer, programmer) ces machines comme s’il s’agissait d’une seule
Ka Besoin de passage à l’échelle des outils d’exploitation : • installation de système d’exploitation • copie de fichiers • lancement de commandes parallèles • systèmes de fichiers • outils de monitoring • etc
Opérations collectives sur un grand nombre de machines • Usages : • Gestion des processus et E/S (lancement de programmes ou commandes parallèles, réseau de contrôle dans un environnement de programmation parallèle ou de monitoring) • Déplacement des données (fichiers, opération collectives dans MPI, installation de l’OS) • Etc • Techniques : multicast, arbres couvrants
Topologies de communications • séquentiel arbre binomial • multicast : fiabilisation (?) • chaîne • arbre binaire
Gestion de processus : Ka-run(Cyrille Martin) • But : Lancement rapide de processus sur un grand nombre de nœuds. • Contraintes : • Utilisation des daemons standards (rshd) • Récupération de signaux, entrées/sorties • Utilisation du canal de communication crée entre les processus pour diffuser des données
Optimisation du lancement • Une étape = un appel d'exécution distante • Déroulement d'une étape dans le temps: authentification Demande de connexion Création ou échec de connexion • il faut minimiser le nombre d'étapes • arbre binomial • faire plus en une étape • parallélisation d'un appel d'exécution distante
1 2 3 4 Exemples Temps séquentiel arbre pipeline
Plate-forme d’évaluation : I-cluster 225 HP e-PC PIII 733 Mhz Top500 : 82 Gigaflops (385ème)
Installation de système d’exploitation en chaîne : Ka-deploy (Simon Derr) • Données : quelques Gigaoctets • Importance de la bande passante • Solution en deux étapes : • formation d’un chaîne de machines • copie des données en pipeline
Serveur Contrôle Données Client1 Client 2 Client 3 Serveur Disque • Les machines que l’on installe demandent à la machine source (le serveur) l’adresse IP de la fin de la chaîne de diffusion et s ’y connectent • Chacun des clients lit les données en provenance de la chaîne, les écrit sur son disque et les envoie au reste de la chaîne Client 1 Client 2 Client 3 Disque Disque Disque
Performances • Pipeline : débit ~= 10Mo/s (en théorie débit optimal). L’installation de 200 machines prends une vingtaine de minutes. • Multicast : 4 Mo/s vers 100 nœuds, semble se dégrader ensuite • Arbre binomial : Un peu plus lent pour le nombre de machines concerné (6 à 8 étapes nécessaires)
Difficultés • Modélisation complexe : • Sensibilité à la topologie du réseau et à l’opération à réaliser • Synchronisation dans un environnement hétérogène (réseau, cpu, disque) • Tolérance aux pannes • Ingénierie des OS
Conclusion et perspectives • Déploiement très souple d’une grappe (reboot, upgrade, passage en Windows 2000) ou d’un Intranet • Des commandes parallèles performantes • Exploitation d’un intranet • Déploiement dans un environnement grille • Utilisation dans un environnement de programmation parallèle • Intégration à une distribution Linux Mandrake pour cluster
Perspectives : grappe 200 • Plate-formes et outils d’exploitation : • Installation premier trimestre 2001 • Grille de grappes opérationnelle • I-cluster : infrastructure de services sur un Intranet d’entreprise • Applications • Visualisation • « Valorisation » du logiciel Athapascan dans le cadre des projets CLIC et Microsoft