Я обнаружил, что все примеры Theano/Lasagne имеют дело с небольшими наборами данных, такими как mnist и cifar10, которые можно полностью загрузить в память.
Мой вопрос: как написать эффективный код для обучения на больших наборах данных? В частности, как лучше всего подготовить мини-пакеты (включая увеличение данных в реальном времени), чтобы не нагружать GPU?
Может быть, как использовать ImageDataLayer CAFFE? Например, у меня есть большой текстовый файл, который содержит все пути к изображениям и метки. Было бы полезно показать код.
Большое спасибо!