Strumenti Utente

Strumenti Sito


oph:cluster:tofix

Questa è una vecchia versione del documento!


Da far sistemare / controllare

  • risoluzione membership gruppi (anche studenti)
  • formazione xCAT, moduli e “regole” gestione nodi
  • ottimizzazione Gluster non possono ottimizzare di più, suggeriscono BeeGFS
  • configurazione transfer node
  • configurazione di qualche nodo BladeRunner
  • TRESBillingWeights per le GPU (MIG (16 GPU indipendenti) / 2 GPU indipendenti / Overcommit NO)

Attaccarsi ad un nodo con job in esecuzione (per monitoraggio): srun –pty –jobid $JOBID /bin/bash srun –pty –jobid $JOBID -w $NODE /bin/bash sattach TODO

oph/cluster/tofix.1675776634.txt.gz · Ultima modifica: 2023/02/07 13:30 da diego.zuccato@unibo.it

Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki