Загрузка данных изображения, загруженных на диск, в массив numpy в Google Colab

#python-3.x #image-processing #deep-learning #google-colaboratory #image-segmentation

#python-3.x #обработка изображений #глубокое обучение #google-colaboratory #сегментация изображений

Вопрос:

Я работаю над проектом глубокого обучения (сегментация изображений) и решил перенести свою работу в Google colab. Я загрузил записную книжку, а затем использовал следующий код для монтирования диска

 from google.colab import drive
drive.mount('/content/mydrive')
  

Данные представлены в формате двух папок; одна содержит изображения (входные данные в формате .jpg), а другая содержит их маски (ground Truth, в формате .png) для каждого изображения 2600. Для их загрузки я использую следующий код.

 filelist_trainx = sorted(glob.glob('drive/My Drive/Data/Trainx/*.jpg'), key=numericalSort)
X_train = np.array([np.array(Image.open(fname)) for fname in filelist_trainx])

filelist_trainy = sorted(glob.glob('drive/My Drive/Data/Trainy/*.png'), key=numericalSort)
Y_train = np.array([np.array(Image.open(fname)) for fname in filelist_trainy])
  

При загрузке X_train это не занимает много времени, но при запуске Y_train это занимает так много времени, и я заканчиваю прерыванием выполнения ячейки. Кто-нибудь знает, почему это происходит? учитывая, что оба файла содержат данные одинакового размера и занимают мало места — всего 18 МБ. вот пример изображений.
Образец данных

Комментарии:

1. Вы получаете доступ к своим данным со своего диска? Это вызовет проблемы и потребует времени.

2. Исправление заключается в копировании ваших данных в сам colab, а не в доступе к ним непосредственно с вашего Google диска.