... | ... | @@ -37,4 +37,22 @@ How to use local file access when the share disk space cannot handle the load. |
|
|
* [Special tools](Running-the-jobs/Special Tools)
|
|
|
Running Mathematica etc..
|
|
|
|
|
|
[^1]: there might be more than one actual machine to ensure load balancing and fault tolerance. But you only need to remember the logical name. Like *licallo.oca.eu* for the HPC cluster. |
|
|
\ No newline at end of file |
|
|
[^1]: there might be more than one actual machine to ensure load balancing and fault tolerance. But you only need to remember the logical name. Like *licallo.oca.eu* for the HPC cluster.
|
|
|
|
|
|
|
|
|
Size job max:
|
|
|
"En général, la façon la plus rapide (mais par essai erreur) de voir ce genre de choses, c'est de soumettre le job puis de faire un squeue -u operto.
|
|
|
|
|
|
Si le job est coincé (statut PD) par une limite, cela indiquera laquelle.
|
|
|
|
|
|
Sinon, le nombre max de cœurs est généralement donnée par la propriété MaxTRES la la QOS (Quality Of Service) qosoca-par, en ce moment c'est 600:
|
|
|
|
|
|
15:48:58 [alainm@pollux rel]# sacctmgr show QOS qosoca-par format=name,MaxTRES
|
|
|
Name MaxTRES
|
|
|
---------- -------------
|
|
|
qosoca-par cpu=600
|
|
|
15:49:16 [alainm@pollux rel]#
|
|
|
|
|
|
Mais cela peu bouge en fonction de la charge par exemple.
|
|
|
TRES signifie Trackable RESources, qui chez nous sont les cœurs (parce que c'est important de rester intuitif).
|
|
|
" |
|
|
\ No newline at end of file |