Память не восстанавливается при перезапуске процесса

У меня есть задание на Python, которое запускает сеть кафе для обработки изображений на графических процессорах nvidia. Задание берет изображения из очереди rabbitmq, обрабатывает их и записывает результат в другую очередь. Когда я перезапускаю это задание, процессы убиваются, но память не восстанавливается.

Таким образом, после определенного количества перезапусков машина зависает. Как только я убиваю задание, в ps или top не запускается процесс python, но память процессора не восстанавливается.

Как я могу отладить эту проблему?

РЕДАКТИРОВАТЬ: память процессора


person Roshan Singh    schedule 02.03.2016    source источник
comment
Вы имеете в виду память графического процессора или память процессора?   -  person Shai    schedule 02.03.2016
comment
Память процессора. Тот, который вы получаете бесплатно.   -  person Roshan Singh    schedule 03.03.2016


Ответы (1)


Это ваша память графического процессора, которая не освобождается. Получить идентификатор процесса

$ nvidia-smi

а потом

$ kill -9 <process id>
person Harsh Wardhan    schedule 02.03.2016
comment
У меня не запускается процесс, когда я запускаю nvidia-smi. - person Roshan Singh; 03.03.2016
comment
Вы видите процесс, который потребляет дополнительную память? Узнайте процесс с помощью $ ps aux | less. Затем убейте процесс с помощью $ pkill -9 <process id>. - person Harsh Wardhan; 03.03.2016
comment
Ни один процесс не запущен в ps или htop. Похоже, это какая-то ошибка в библиотеке Caffe, которая не освобождает общую память. - person Roshan Singh; 04.03.2016
comment
Я не понимаю. Когда вы говорите, что память ЦП не освобождается, это означает, что должен быть какой-то процесс, потребляющий память. Вы определенно упускаете из виду это. Запустите Caffe еще раз, а затем проверьте память, используемую различными процессами в процессоре и графическом процессоре, в другом терминале. - person Harsh Wardhan; 04.03.2016