Что означает состояние «слива»?

Когда я использую sinfo, я вижу следующее:

$ sinfo
PARTITION AVAIL  TIMELIMIT  NODES  STATE NODELIST
[...]
RG3          up 28-00:00:0      1  drain rg3hpc4
[...]

Что означает состояние «слива»?


person Martin Thoma    schedule 18.03.2014    source источник


Ответы (1)


Это означает, что на этом узле не будет запланировано никаких дальнейших заданий, но текущие задания будут продолжать выполняться (в отличие от установки узла down, которая убивает все задания, выполняющиеся на узле).

Узлы часто устанавливаются в это состояние, чтобы можно было выполнять некоторые операции обслуживания после завершения всех запущенных заданий.

На справочной странице команды scontrol:

Если вы хотите удалить узел из обслуживания, вы обычно хотите установить для него состояние «DRAIN».

Обратите внимание, что системный администратор, скорее всего, указал причину, по которой узел слит, и вы можете увидеть эту причину с помощью

sinfo -R
person damienfrancois    schedule 05.05.2014
comment
Чтобы возобновить узел, это сработало для меня: scontrol update nodename=YOURNODEHERE state=resume - person tokland; 20.12.2018