Strumenti Utente

Strumenti Sito


oph:cluster:tofix

Da far sistemare / controllare

  • risoluzione membership gruppi (anche studenti)
  • formazione xCAT, moduli e “regole” gestione nodi
  • ottimizzazione Gluster non possono ottimizzare di più, suggeriscono BeeGFS
  • configurazione transfer node
  • configurazione di qualche nodo BladeRunner
  • TRESBillingWeights per le GPU (MIG (16 GPU indipendenti) / 2 GPU indipendenti / Overcommit NO)

Attaccarsi ad un nodo con job in esecuzione (per monitoraggio):

srun --pty --jobid $JOBID /bin/bash
srun --pty --jobid $JOBID -w $NODE /bin/bash
sattach TODO
oph/cluster/tofix.txt · Ultima modifica: 2023/02/07 13:30 da diego.zuccato@unibo.it

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki