Разделение поездов / тестов TensorFlow Dataset

Я пытаюсь загрузить набор данных coil100 из наборов данных TensorFlow. Этот набор данных, согласно документации, идет только с разделением train. Я хочу разделить набор данных на тренировку / тест для локального воспроизведения, однако даже после внимательного прочтения документации TensorFlow Dataset у меня есть много проблем. Это моя попытка:

import tensorflow_datasets as tfds

ds_train, ds_info = tfds.load(
'coil100',
split=['train'],
shuffle_files=True,
as_supervised=True,
with_info=True,

)

train = ds_train[0][0: 7000]
test = ds_train[0][7000:]

Однако это приводит к этой ошибке:

TypeError: '_OptionsDataset' object is not subscriptable

У меня возникает много проблем с пониманием того, как подготавливаются некоторые наборы данных, поскольку возвращаемые данные не повторяются, и все это не очень четко объясняется в документации. Есть ли какой-нибудь дополнительный ресурс, где я наконец смог бы понять, как работать с любым набором данных из этой библиотеки?


person sanna    schedule 21.12.2020    source источник


Ответы (1)


См. Документацию по Tensorflow Datasets: Splits and Slicing. Что вам нужно, так это:

tfds.load('coil100', split=['train[:7000]', 'train[7000:]'])
person Nicolas Gervais    schedule 21.12.2020