масштабировать вверх / вниз кластер slurm

Я только недавно начал изучать сларм, жару и у меня есть несколько вопросов.

У меня есть существующий кластер slurm, созданный с использованием ansible и heat. Heat создает кластер, а ansible просто устанавливает / настраивает все необходимое программное обеспечение на всех узлах.

Теперь я хотел добавить новые вычислительные узлы в существующий кластер. Я пробовал команду «openstack update», но она восстановит все существующие узлы. Есть ли подходящий способ добавления новых вычислительных узлов без восстановления существующих?

Я также рассмотрел автоматическое масштабирование на основе использования процессора с использованием облакомера. Кажется, это работает, но без перезапуска slurm, как сообщить существующим узлам в кластере slurm, что добавлены новые вычислительные узлы? Возможно ли изменить slurm.conf, slurmdbd.conf, / etc / hosts, knownhosts и т. Д. Без перезапуска?

Цель состоит в том, чтобы, когда использование ЦП достигнет определенного уровня, незаметно добавить новые вычислительные узлы и настроить их как часть существующего кластера.

Спасибо,


person yis    schedule 20.02.2017    source источник


Ответы (1)


Это одно из ограничений в slurm, изменение файла конфигурации ИЛИ добавление нового узла, безусловно, должно потребовать от остальных демонов slurm или перезагрузки демона slurmctld для чтения внесенных вами новых изменений конфигурации.

На всякий случай, если slurm.conf хранится централизованно на NFS, перезагрузка демона контроллера - это хорошо, но вы можете увидеть некоторые предупреждения от других узлов.

person sec hunter    schedule 11.07.2018