Когда я использую sinfo
, я вижу следующее:
$ sinfo
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST
[...]
RG3 up 28-00:00:0 1 drain rg3hpc4
[...]
Что означает состояние «слива»?
Когда я использую sinfo
, я вижу следующее:
$ sinfo
PARTITION AVAIL TIMELIMIT NODES STATE NODELIST
[...]
RG3 up 28-00:00:0 1 drain rg3hpc4
[...]
Что означает состояние «слива»?
Это означает, что на этом узле не будет запланировано никаких дальнейших заданий, но текущие задания будут продолжать выполняться (в отличие от установки узла down
, которая убивает все задания, выполняющиеся на узле).
Узлы часто устанавливаются в это состояние, чтобы можно было выполнять некоторые операции обслуживания после завершения всех запущенных заданий.
На справочной странице команды scontrol:
Если вы хотите удалить узел из обслуживания, вы обычно хотите установить для него состояние «DRAIN».
Обратите внимание, что системный администратор, скорее всего, указал причину, по которой узел слит, и вы можете увидеть эту причину с помощью
sinfo -R
scontrol update nodename=YOURNODEHERE state=resume
- person tokland; 20.12.2018