Lancement des processus MPI
Cet article indique comment sont lancés les processus MPI sous Slurm
Références
Processus MPI
Principe : rappel
Problème
Se pose le problème de savoir
qui (quel programme) va lancer les processus MPI
comment sera déterminé la liste des machines à utiliser, et le nombre de processus à exécuter sur chacune
quel mécanisme sera utilisé pour exécuter les processus sur des machines distantes
à quelle vitesse ce mécanisme se déroule (les gros cluster comportant plusieurs centaines ou milliers de nœuds)
Intégration avec l'ordonnanceur
Sur un cluster, les ressources, donc la liste des noeuds à utiliser, sont allouées dynamiquement par l'ordonnanceur
L'ordonnanceur dispose déjà d'un mécanisme de lancement de processus sur les noeuds
Les librairies MPI et les ordonnanceurs (slurm et d'autres) ont essayé de converger pour apporter une certaine intégration…
Interface PMI
Avec slurm
Plusieurs modes d'intégration sont possibles entre les librairies MPI et slurm
Le mode choisi est
Pour Intel MPI, le choix de la librairie PMI est indiqué via la variable d'environnement I_MPI_PMI_LIBRARY
positionné par le module