Есть хороший вопрос (узнать Процессорное время и использование памяти для задания slurm) о том, как получить время ЦП и использование памяти для задания slurm и spinup, имеет хороший ответ (https://stackoverflow.com/a/56555505/4570472). Однако, если я правильно понимаю, seff <job id>
возвращает Memory Efficiency
, что соответствует MAXRSS за все время работы задания.
Как получить временные ряды использования памяти (и, возможно, ЦП)?
Я хотел бы понять, почему моим slurm-задачам не хватает памяти после 6+ часов нормальной работы.
psutil
для python) в файл. - person jakub   schedule 04.08.2020