Ceci est une ancienne révision du document !
Cet article donne une liste plus complètes des commandes du logiciel slurm. Vous déjà être familier avec les bases de Slurm.
Dans les exemples de batch, nous n'avons indiqué que quelques-unes des options de soumission possibles.
Pour connaître toutes les options possibles, consultez la page de manuel UNIX de la commande sbatch
Toutes les lignes #SBATCH
des fichiers batch sont en réalité des options de la commande sbatch
sbatch
Slurm peut expédier des mails lorsqu'un job change d'état. Par exemple, pour recevoir un mail à la fin d'un job, utilisez les options suivantes :
--mail-type=end --mail-user=votre.nom@votre.domaine
Voir tous les jobs dans la file :
squeue -l smap
Voir les détails d'un job :
scontrol show job JOB_ID
Pour connaître la quantité de ressources consommées par un job en cours :
sstat -j JOB_ID
Pour lire les informations de comptabilité (accounting) enregistrées par slurm sur un job terminé :
sacct -j JOB_ID sacct -j JOB_ID -l sacct -j JOB_ID -o JobID,User,Account,partition,qos,Submit,Start,End,exitcode,elapsed,cputime,NodeList,alloccpus,state
La commande sacct
permet d'afficher d'autres métriques avec l'option -o
; pour connaître toutes les données visualisables, voir sacct –helpformat
Pour lister les noeuds déclarés dans slurm avec leurs caractéristiques et l'allocation actuelle de CPU et de mémoire :
scontrol show nodes
Pour lister seulement l'état des noeuds 01 à 28 :
scontrol show nodes node[01-28]
Pour connaître les jobs utilisant un nœud ou un ensemble de nœuds particuliers (node31
ici) :
squeue -w node31 squeue -w node31 -o "%.7i %.19P %.8j %.8u %.8T %.10M %.9l %.6D %R"
Pour lister les partitions avec leurs caractéristiques :
scontrol show partitions
Pour voir l'état des partitions et des noeuds :
sinfo sinfo -a -o "%20P %14C %14F %10p"
Lister les QoS et leur paramétrage :
sacctmgr list qos