PyTorch и Google Colab: ImageFolder загружает не все изображения

Я использую PyTorch для задачи классификации изображений «Кошки против собак» (9999 изображений кошек и 9999 изображений собак) в Google colab со следующим фрагментом кода для создания загрузчика данных:

import torchvision
from torchvision import transforms
data = torchvision.datasets.ImageFolder(r'/content/drive/My Drive/kaggle/trainset/trainset',transform = transforms.ToTensor())

а длина data - 6594 (по сравнению с ожидаемым 19998). Я пытаюсь перезапустить среду выполнения и каждый раз получаю разное количество изображений. Затем я попытался запустить тот же фрагмент кода в блокноте jupyter, и он сработал, как и ожидалось, загрузив все изображения 19998 года. Что я делаю не так в колабе?


person QQQQQQQ    schedule 06.02.2019    source источник
comment
Я бы сначала попробовал скопировать данные из /content/drive/. Это работает?   -  person Bob Smith    schedule 07.02.2019


Ответы (1)


Я столкнулся с той же проблемой и решил, что вы хотите классифицировать кошку и рыбу simple_example_link с помощью Google Colab, вы должны сначала загрузить изображения с помощью download.py в данной ссылке (запустите этот файл download.py в ячейке colab), а затем вы увидите поезд, val и test папки будут созданы в левой части Colab (см. прикрепленное изображение), а затем обычно вы просто добавляете путь к папкам в ImageFolder, как я это сделал. если вы хотите смонтировать свой диск, просто нажмите MOUNT DRIVE, как это видно на изображении ниже слева введите описание изображения здесь

person javac    schedule 12.11.2019