oph:cluster:tofix
Questa è una vecchia versione del documento!
Da far sistemare / controllare
- risoluzione membership gruppi (anche studenti)
- formazione xCAT, moduli e “regole” gestione nodi
ottimizzazione Glusternon possono ottimizzare di più, suggeriscono BeeGFS- configurazione transfer node
- configurazione di qualche nodo BladeRunner
- TRESBillingWeights per le GPU (MIG (16 GPU indipendenti) / 2 GPU indipendenti / Overcommit NO)
Attaccarsi ad un nodo con job in esecuzione (per monitoraggio): srun –pty –jobid $JOBID /bin/bash srun –pty –jobid $JOBID -w $NODE /bin/bash sattach TODO
oph/cluster/tofix.1675776634.txt.gz · Ultima modifica: 2023/02/07 13:30 da diego.zuccato@unibo.it