Outils pour utilisateurs

Outils du site


slurm:slurm-avance

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentes Révision précédente
Prochaine révision
Révision précédente
slurm:slurm-avance [2015/06/11 15:22]
montap01 [Job terminé]
slurm:slurm-avance [2015/07/09 16:43] (Version actuelle)
montap01 [Liste]
Ligne 23: Ligne 23:
  
 ===== Les jobs ===== ===== Les jobs =====
-==== Voir les jobs en attente et en cours ====+==== Liste ====
 Voir tous les jobs de slurm : Voir tous les jobs de slurm :
   squeue -l   squeue -l
 +  squeue -o "%.6i %.12u %.14j %.14P %.14q %.14a %.9T %.9Q %.10V %.10M %.9l %.6m %.6C %.6D %R"
   smap   smap
  
Ligne 31: Ligne 32:
   squeue-summary   squeue-summary
  
 +Exemple de commande pour compter le nombre de CPU en cours d'utilisation par un usager : 
 +  squeue -u <LOGIN> -t running -o "%C" --noheader | awk 'BEGIN{ncpus=0}{ncpus+=$1}END{print "CPUS utilisees : "ncpus}'
 +==== Informations détaillées ====
 Voir les détails d'un job : Voir les détails d'un job :
-  scontrol show job JOB_ID+  scontrol --details show job JOB_ID
  
 Pour connaître la quantité de ressources consommées par un job en cours :  Pour connaître la quantité de ressources consommées par un job en cours : 
   sstat -j JOB_ID   sstat -j JOB_ID
- 
- 
-==== Job terminé ==== 
-Pour lire les informations de comptabilité (//accounting//) enregistrées par slurm sur un job terminé : 
-  sacct -j JOB_ID 
-  sacct -j JOB_ID -l 
-  sacct -j JOB_ID -o JobID,User,Account,partition,qos,Submit,Start,End,exitcode,elapsed,cputime,NodeList,alloccpus,state 
- 
-La commande ''sacct'' permet d'afficher d'autres métriques avec l'option ''-o'' ; pour connaître toutes les données visualisables, voir ''%%sacct --helpformat%%'' 
  
 ==== Priorité des jobs en attente ==== ==== Priorité des jobs en attente ====
Ligne 57: Ligne 52:
 Synthèse des 30 derniers jours (commande DSI)  Synthèse des 30 derniers jours (commande DSI) 
   sreport-summary   sreport-summary
 +
 +
 +==== Détails d'un job terminé ====
 +Pour lire les informations de comptabilité (//accounting//) enregistrées par slurm sur un job terminé :
 +  sacct -j JOB_ID
 +  sacct -j JOB_ID -l
 +  sacct -j JOB_ID -o JobID,User,Account,partition,qos,Submit,Start,End,exitcode,elapsed,cputime,NodeList,alloccpus,state
 +
 +La commande ''sacct'' permet d'afficher d'autres métriques avec l'option ''-o'' ; pour connaître toutes les données visualisables, voir ''%%sacct --helpformat%%''
  
 ==== Calcul du fair-share ==== ==== Calcul du fair-share ====
Ligne 62: Ligne 66:
   sshare    sshare 
   sshare -u USER   sshare -u USER
 +
 ===== Les noeuds ===== ===== Les noeuds =====
 Pour lister les noeuds déclarés dans slurm avec leurs caractéristiques et l'allocation actuelle de CPU et de mémoire : Pour lister les noeuds déclarés dans slurm avec leurs caractéristiques et l'allocation actuelle de CPU et de mémoire :
Ligne 72: Ligne 77:
 Pour connaître les jobs utilisant un nœud ou un ensemble de nœuds particuliers (''node31'' ici) : Pour connaître les jobs utilisant un nœud ou un ensemble de nœuds particuliers (''node31'' ici) :
   squeue -w node31   squeue -w node31
-  squeue -w node31 -o "%.7i %.19P %.8j %.8u %.8T %.10M %.9l %.6D %R" 
  
 ===== Les partitions ===== ===== Les partitions =====
slurm/slurm-avance.1434028963.txt.gz · Dernière modification: 2015/06/11 15:22 de montap01