Как сохранить numpy массив набора данных изображений?

#python #arrays #image #tensorflow2.0 #conv-neural-network

#python #массивы #изображение #tensorflow2.0 #conv-нейронная сеть

Вопрос:

Я использую свой собственный набор данных для обучения CNN. Я преобразовал изображения в массив numpy, а метки — в другой массив. Как я могу сохранить их, чтобы иметь возможность загружать данные, когда мне нужно обучить модель? Я попробовал pickle, но размер данных слишком велик для этого.

Я использую python3.7 и tensorflow 2.1.1 .

Ответ №1:

Для этого есть много вариантов, один из которых — сохранить его в виде файла csv.

 import numpy as np
np.savetxt("foo.csv", a, delimiter=",")
  

Для более эффективного способа вы можете использовать HDF5 с h5py.

 import h5py
h5f = h5py.File('data.h5', 'w')
h5f.create_dataset('dataset_1', data=a)
  

Комментарии:

1. Будет ли он сохранять каждый из ярлыков и изображений отдельно или объединенными?

2. Можете ли вы дать больше способов. Спасибо

3. Он сохраняет их вместе, есть ли что-то конкретное, чего вы хотите достичь, и вам нужны способы, отличные от описанных?

4. массив изображений равен 4d. Я хочу загружать его всякий раз, когда хочу обучить модель. Эффективен ли этот способ.

5. Я добавил еще один способ для более эффективного хранения данных.