Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentes Révision précédente Prochaine révision | Révision précédente | ||
slurm:partitions [2022/12/21 14:24] montap01 [Partitions ouvertes à tout chercheur] |
slurm:partitions [2024/10/02 17:22] (Version actuelle) montap01 |
||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
~~SLIDESHOW theme=yatil level=4~~ | ~~SLIDESHOW theme=yatil level=4~~ | ||
- | ====== Partitions de CALI-2 ====== | + | ====== Partitions de CALI-2, Feature |
Cet article décrit deux des notions fondamentales de l' | Cet article décrit deux des notions fondamentales de l' | ||
* les // | * les // | ||
Ligne 24: | Ligne 24: | ||
^Partition ^Noeuds ^Durée max / job ^# noeuds max / job ^# CPU Max actives / User ^# Max Jobs actif (soumis) / User ^ Infiniband ^ Pré-emptible ? ^ | ^Partition ^Noeuds ^Durée max / job ^# noeuds max / job ^# CPU Max actives / User ^# Max Jobs actif (soumis) / User ^ Infiniband ^ Pré-emptible ? ^ | ||
^rapide | ^rapide | ||
- | ^normal | + | ^normal |
- | ^cluster | + | ^cluster |
- | ^gpu |Ceux avec GPU | 2 J| -| | + | |
Pour ceux qui veulent en savoir plus, les //limites// ci-dessus sont imposées à travers plusieurs mécanismes : | Pour ceux qui veulent en savoir plus, les //limites// ci-dessus sont imposées à travers plusieurs mécanismes : | ||
Ligne 44: | Ligne 43: | ||
* L' | * L' | ||
- | ==== Partitions à accès restreint ==== | + | ==== Partitions |
=== Principe === | === Principe === | ||
Certains noeuds de calcul ont été financés spécifiquement par des laboratoires ou groupes de chercheurs : | Certains noeuds de calcul ont été financés spécifiquement par des laboratoires ou groupes de chercheurs : | ||
Ligne 67: | Ligne 66: | ||
+ | ===== Les " | ||
+ | ==== Principe ==== | ||
+ | Chaque //noeud// est marqué avec des // | ||
- | ===== QoS ===== | + | Sur CALI, vous pouvez utiliser les //features// pour plusieurs usages |
- | La QoS, ou //Quality of Service | + | * demander un type de processeur |
- | * imposer | + | * demander |
- | * ou pour contrôler l' | + | * demander des noeuds **qui ont le réseau Infiniband** |
- | ==== Choix de la QoS ==== | + | ==== Eviter |
- | * Dans notre configuration, une seule QoS est utilisée avec une partition | + | Nous avons déjà vu que certains noeuds sont à la fois dans des partitions ouvertes à tout le monde, et dans des partitions // |
- | * Par simplicité, elle porte le même nom que la partition associée (sauf pour les "gold") | + | |
- | * La QoS est **automatiquement sélectionnée** par rapport à la partition choisie, **vous n'avez donc pas besoin | + | |
- | * La liste ci-après vous permet de connaître les limites imposées par les QoS associées aux partitions | + | |
- | ==== Liste ==== | + | |
- | ^ QoS ^ # CPU max ^ # Noeuds max ^ # CPU max / util. ^ # job max actif / utilisateur ^ # job max en file / utilisateur ^ Facteur d' | + | |
- | ^ rapide | | + | |
- | ^ normal | | + | |
- | ^ cluster| | + | |
- | ^ cluster-nopreempt | 88| 14| | | + | |
- | ^ cluster-e5v4 | + | |
- | ^ gold-geist-lcsn | + | |
- | ^ gold-geist-genolim| | + | |
- | ^ gold-geist-umr850 | | | | | + | |
- | ^ gold-ipam-spcts | + | |
- | ==== S'informer | + | Pour éviter ce mécanisme, appelez la //feature// '' |
- | * Lister les QoS : '' | + | <file bash> |
- | * Connaître les //QoS// avec lesquelles vous pouvez soumettre | + | #SBATCH --constraint=NoPreemption |
- | sacctmgr list user $(whoami) WithAssoc Format=User%18, | + | </ |
- | </code> | + | |
- | * Lister | + | __Inconvénient__ le job sera limité aux noeuds les plus anciens de CALI, il ne pourra pas s'exécuter |
- | sacctmgr list user WithAssoc Format=User%18, | + | |
- | </code> | + | ==== Choisir un type de processeur ==== |
+ | Les partitions communes sont hétérogènes. Vous pouvez spécifier sur quel processeur vous voulez exécuter le job. | ||
+ | |||
+ | Liste des //feature// déclarés (correspondant au nom du processeur) : | ||
+ | * '' | ||
+ | * '' | ||
+ | * '' | ||
+ | |||
+ | Pour que le job se lance sur des processeurs E5-2630-v4, il faut par exemple ajouter: | ||
+ | <file bash> | ||
+ | #SBATCH --constraint=Xeon-E5-2630-v4 | ||
+ | </file> | ||
+ | |||
+ | Consultez la page [[: | ||
+ | |||
+ | ==== Réseau Infiniband ==== | ||
+ | Tous les noeuds n'ont pas de réseau Infiniband. | ||
+ | |||
+ | En pratique, seuls 4 noeuds, dont 3 dédiés GPU, ne sont pas équipés. Si vous voulez être certains que votre job disposera du réseau Infiniband (utile | ||
+ | <file bash> | ||
+ | #SBATCH --constraint=Infiniband | ||
+ | </file> | ||
- | ===== Références ===== | ||
- | * http:// |