Открих, че всички примери за Theano/Lasagne се занимават с малък набор от данни като mnist и cifar10, които могат да бъдат заредени в паметта напълно.
Въпросът ми е как да напиша ефективен код за обучение на големи масиви от данни? По-конкретно, кой е най-добрият начин за подготовка на мини-партиди (включително увеличаване на данните в реално време), за да поддържате графичния процесор зает?
Може би като използването на ImageDataLayer на CAFFE? Например, имам голям txt файл, който съдържа всички пътища и етикети на изображения. Ще бъдем благодарни да покажете някакъв код.
Благодаря ти много!