Я только недавно начал изучать сларм, жару и у меня есть несколько вопросов.
У меня есть существующий кластер slurm, созданный с использованием ansible и heat. Heat создает кластер, а ansible просто устанавливает / настраивает все необходимое программное обеспечение на всех узлах.
Теперь я хотел добавить новые вычислительные узлы в существующий кластер. Я пробовал команду «openstack update», но она восстановит все существующие узлы. Есть ли подходящий способ добавления новых вычислительных узлов без восстановления существующих?
Я также рассмотрел автоматическое масштабирование на основе использования процессора с использованием облакомера. Кажется, это работает, но без перезапуска slurm, как сообщить существующим узлам в кластере slurm, что добавлены новые вычислительные узлы? Возможно ли изменить slurm.conf, slurmdbd.conf, / etc / hosts, knownhosts и т. Д. Без перезапуска?
Цель состоит в том, чтобы, когда использование ЦП достигнет определенного уровня, незаметно добавить новые вычислительные узлы и настроить их как часть существующего кластера.
Спасибо,