oph:cluster:tofix
Da far sistemare / controllare
- risoluzione membership gruppi (anche studenti)
- formazione xCAT, moduli e “regole” gestione nodi
ottimizzazione Glusternon possono ottimizzare di più, suggeriscono BeeGFS- configurazione transfer node
- configurazione di qualche nodo BladeRunner
- TRESBillingWeights per le GPU (MIG (16 GPU indipendenti) / 2 GPU indipendenti / Overcommit NO)
Attaccarsi ad un nodo con job in esecuzione (per monitoraggio):
srun --pty --jobid $JOBID /bin/bash srun --pty --jobid $JOBID -w $NODE /bin/bash sattach TODO
oph/cluster/tofix.txt · Ultima modifica: 2023/02/07 13:30 da diego.zuccato@unibo.it