Набор данных TensorFlow / разделение теста

#python #tensorflow #keras #tensorflow2.0 #tensorflow-datasets

#python #tensorflow #keras #tensorflow2.0 #tensorflow-наборы данных

Вопрос:

Я пытаюсь загрузить набор данных coil100 из наборов данных TensorFlow. Этот набор данных, согласно документации, поставляется только с train разделением. Я хочу разделить набор данных в train / test для локального воспроизведения, однако, даже после внимательного прочтения документации по набору данных TensorFlow, у меня много проблем. Это моя попытка:

 import tensorflow_datasets as tfds

ds_train, ds_info = tfds.load(
'coil100',
split=['train'],
shuffle_files=True,
as_supervised=True,
with_info=True,

)

train = ds_train[0][0: 7000]
test = ds_train[0][7000:]
 

Однако это приводит к этой ошибке:

TypeError: '_OptionsDataset' object is not subscriptable

У меня возникает много проблем с пониманием того, как подготавливаются некоторые наборы данных, поскольку возвращаемые данные не являются итеративными, и все это на самом деле не совсем понятно объясняется в документах. Есть ли какой-либо дополнительный ресурс, где я мог бы, наконец, понять, как работать с любым набором данных из этой библиотеки?

Ответ №1:


Смотрите Документацию по наборам данных Tensorflow: разделение и нарезка. Что вам нужно, так это:

 tfds.load('coil100', split=['train[:7000]', 'train[7000:]'])