Найти временные ряды ЦП и памяти Slurm Job?

Есть хороший вопрос (узнать Процессорное время и использование памяти для задания slurm) о том, как получить время ЦП и использование памяти для задания slurm и spinup, имеет хороший ответ (https://stackoverflow.com/a/56555505/4570472). Однако, если я правильно понимаю, seff <job id> возвращает Memory Efficiency, что соответствует MAXRSS за все время работы задания.

Как получить временные ряды использования памяти (и, возможно, ЦП)?

Я хотел бы понять, почему моим slurm-задачам не хватает памяти после 6+ часов нормальной работы.


person Rylan Schaeffer    schedule 04.08.2020    source источник
comment
Всякий раз, когда мне приходилось это делать, я добавлял в свой скрипт цикл, который печатал память и использование процессора (используя psutil для python) в файл.   -  person jakub    schedule 04.08.2020