Table des matières

Voir cette page sous forme de diaporama.

Ressources matérielles dans le cluster

Le cluster comporte :

Noeud frontal

Noeuds de calculs

Le choix du type de GPU se fait lors de la soumission de job sous Slurm, en spécifiant un type de gpu : --gres=gpu:h100:1 par exemple pour demander une GPU H100, à remplacer par l40 pour une L40.

Réseau interconnexion

Les communications MPI peuvent utiliser du RDMA via le protocole RoCE – FIXME

Stockage