Как отправлять задания в несколько разделов одновременно (Slurm)

После того, как я отправил задание узлу / разделу cn430 сегодня, я обнаружил, что узел все еще одержим,

введите описание изображения здесь

После завершения предыдущего задания моя работа все еще не запускалась из-за приоритета. Затем я заметил, что все эти вакансии имеют один и тот же префикс, а именно 4988443, который опережает мой идентификатор вакансии 4988560.

Кажется, что пользователь отправил около 1000 заданий вместе с одинаковым приоритетом в нескольких разделах,

введите описание изображения здесь  введите описание изображения здесь

Мне интересно, как это реализовать.


person Panfeng Li    schedule 06.02.2019    source источник


Ответы (1)


Во-первых, cn430 действительно выглядит как узел, а не как раздел. Раздел, которому он принадлежит, кажется, называется shared-gp.

Вы видите массив заданий. Это способ отправить большое количество заданий, которые отличаются только определенным параметром. Каждое задание в массиве планируется независимо, поэтому, если вы не запрашиваете конкретный узел (например, с -w или --nodelist), Slurm будет транслировать их доступным узлам.

Обратите внимание, что приоритеты заданий будут уменьшаться со временем, если применяется faishare, поэтому задания, которые в настоящее время ожидают выполнения, будут иметь меньший приоритет из-за тех, которые в настоящее время выполняются.

person damienfrancois    schedule 07.02.2019