Les deux révisions précédentes
Révision précédente
Prochaine révision
|
Révision précédente
|
slurm:les-bases [2022/12/21 12:44] montap01 [Travaux "normaux"] |
slurm:les-bases [2024/10/02 17:23] (Version actuelle) montap01 [Calcul sur GPU] |
Dans notre exemple : | Dans notre exemple : |
* ''%%--%%partition=rapide'' sélectionne la //partition// nommée ''rapide'' | * ''%%--%%partition=rapide'' sélectionne la //partition// nommée ''rapide'' |
* ''%%--%%ntasks=1'' donne le nombre de processus | * ''%%--%%ntasks=1'' donne le nombre de processus qui sera exécuté dans le batch -- En général, on met "1" pour un programme séquentiel ou multi-threadé, une valeur > 1 seulement pour les programmes MPI |
* ''%%--%%mem-per-cpu=100'' donne la **quantité de mémoire en Mo** pour chaque CPU. **Le job sera tué si la quantité consommée excède la valeur demandée** | * ''%%--%%mem-per-cpu=100'' donne la **quantité de mémoire en Mo** pour chaque CPU. Le job sera tué si la quantité consommée excède la valeur demandée :!: |
* ''%%--%%time=00:30:00'' donne la durée maximale du job, au format JOUR-HH:MM:SS . **Le job sera tué si la quantité consommée excède la valeur demandée** | * ''%%--%%time=00:30:00'' donne la durée maximale du job, au format JOUR-HH:MM:SS . Le job sera tué si la quantité consommée excède la valeur demandée :!: |
| |
Dans sa seconde partie, le fichier contient la commandes à exécuter. | Dans sa seconde partie, le fichier contient la ou les commandes à exécuter. |
| |
La commande ''sbatch'' permet de soumettre le fichier batch, autrement dit de créer un //job// slurm qui sera exécuté dès que les ressources demandées seront disponibles. ''sbatch'' a affiché le //Job ID//, un numéro unique associé au job soumis. | La commande ''sbatch'' permet de soumettre le fichier batch, autrement dit de créer un //job// slurm qui sera exécuté dès que les ressources demandées seront disponibles. ''sbatch'' a affiché le //Job ID//, un numéro unique associé au job soumis. |
| |
| Toutes les directives (''#SBATCH ...'') sont en pratique des //options// de la commande ''sbatch''. Il est simplement plus facile de les inscrire dans le fichier //batch// que de les taper sur la ligne de commande. |
===== Où est mon job ? Comment l'arrêter ? ===== | ===== Où est mon job ? Comment l'arrêter ? ===== |
Une fois votre //job// soumis, vous pouvez examiner la //queue//, c'est-à-dire la liste des travaux en attente ou en cours d'éxécution. | Une fois votre //job// soumis, vous pouvez examiner la //queue//, c'est-à-dire la liste des travaux en attente ou en cours d'éxécution. |
squeue -l | squeue -l |
| |
Les //job// ont un //état// associé : | Les //job// ont un //état// associé -- Les 2 principaux sont : |
* ''PENDING'' : en attente | * ''PENDING'' : en attente |
* ''RUNNING'' : en cours d'exécution | * ''RUNNING'' : en cours d'exécution |
Slurm exécute le job depuis le dossier où vous étiez quand vous avez soumis le job. | Slurm exécute le job depuis le dossier où vous étiez quand vous avez soumis le job. |
| |
Par défaut, les sorties standards et d'erreur sont redirigés vers le fichier ''slurm-<JOB_ID>.out'' | Par défaut, les sorties standards et d'erreur (qui s'affichent sur le terminal) sont redirigées vers le fichier ''slurm-<JOB_ID>.out'' |
| |
==== Dépassement des ressources ==== | ==== Dépassement des ressources ==== |
* certaines sont //pré-emptibles// : un job en cours pourra être suspendu s'il faut libérer des ressources pour un autre, plus prioritaire :!: | * certaines sont //pré-emptibles// : un job en cours pourra être suspendu s'il faut libérer des ressources pour un autre, plus prioritaire :!: |
| |
Vous pourrez par la suite consulter la liste complète des [[partitions-qos | partitions utilisables]], ou la page [[:gpu:utilisation | utilisation des noeuds GPU]]. Nous présentons ci-après les choix les plus usuels. | Vous pourrez par la suite consulter la liste complète des [[partitions| partitions utilisables]], ou la page [[:gpu:utilisation | utilisation des noeuds GPU]]. Nous présentons ci-après les choix les plus usuels. |
| |
==== Travaux de très courte durée ==== | ==== Travaux de très courte durée ==== |
* pour les jobs les plus communs (**2 jours maximum**) | * pour les jobs les plus communs (**2 jours maximum**) |
| |
==== Calcul sur GOPU ==== | |
Partition ''gpu'' | |
==== Points d'attention sur les ressources ==== | ==== Points d'attention sur les ressources ==== |
* Vous **devez** indiquer les ressources mémoire et temps nécessaires, car les valeurs par défaut sont très basses et ne permettraient certainement pas à votre travail de se terminer | * Vous **devez** indiquer les ressources mémoire et temps nécessaires, car les valeurs par défaut sont très basses et ne permettraient certainement pas à votre travail de se terminer |