У меня есть доступ через ssh к кластеру из n GPU. Tensorflow автоматически дал им имена gpu:0,...,gpu:(n-1).
У других тоже есть доступ, и иногда они берут случайный gpu. Я не размещал никакие tf.device()
явно, потому что это громоздко, и даже если бы я выбрал номер j-й видеокарты и что кто-то уже использует номер j-й видеокарты, это было бы проблематично.
Я хотел бы просмотреть использование графического процессора и найти первый, который не используется, и использовать только этот. Я думаю, кто-то мог бы проанализировать вывод nvidia-smi
с помощью bash, получить переменную i и передать эту переменную i скрипту tensorflow в качестве номера используемого графического процессора.
Я никогда не видел ни одного примера этого. Я думаю, что это довольно распространенная проблема. Каким будет самый простой способ сделать это? Доступен ли чистый тензорный поток?