Как импортировать несколько изображений из URL в tensorflow?

#python #tensorflow #keras

#python #tensorflow #keras

Вопрос:

У меня есть файл json, который содержит URL-адреса изображений и метки. Я пытаюсь загрузить изображения с помощью tf.keras.utils.get_file() . Таким образом, я могу загружать только одно изображение за раз. Я добавил все URL-адреса в список URL-адресов. Затем я попытался загрузить изображения с URL-адресов в новый список с помощью tf.keras.utils.get_file() . Почему это не работает? Структура файла Json

 {"ID":"-","DataRow ID":"-","Labeled Data":"url is here!","Label":{"dorsaalinen kallistuskulma":[{"geometry":{"x":217,"y":269}},{"geometry":{"x":243,"y":263}}]},"Created By":"-","Project Name":"syvärit (testi)","Created At":"","Seconds to Label":42.286,"External ID":"image5 (2).png","Agreement":null,"Dataset Name":"ranne yhdistelmä","Reviews":[],"View Label":"-"},{"ID":"-","DataRow ID":"-","Labeled Data":"url is here","Label":{"dorsaalinen kallistuskulma":[{"geometry":{"x":217,"y":266}},{"geometry":{"x":243,"y":263}}]},"Created By":"-","Project Name":"syvärit (testi)","Created At":"","Seconds to Label":16.801,"External ID":"image5.png","Agreement":null,"Dataset Name":"ranne yhdistelmä","Reviews":[],"View Label":""}]

  

Код

     import json
    import tensorflow as tf

    with open(filename) as f:
        data = json.load(f)

    # loading json data (url's)to list
    url = []
    for object in data:
        url.append(object['Labeled Data'])

    # loading the images
    pictures =[]
    for i in url:
        pictures = tf.keras.utils.get_file('fname', i, untar=True)
        # loads only one file and if I use pictures.append(tf.keras.utils.get_file) it doesn't download anything.
  

Комментарии:

1. Можете ли вы предоставить часть файла json, чтобы я мог воспроизвести код?

2. Я добавил файловую структуру json

3. Рассматривали ли вы возможность использования dataset api?

Ответ №1:

Вы можете попробовать с gapcv . Это фреймворк для предварительной обработки данных для ML. Вот как это работает:

установить gapcv :

pip install gapcv

импортировать Images из vision :

from gapcv.vision import Images

небольшое исправление в вашем файле json, поскольку gapcv читает json как:

смотрите документацию:

 [
    {'label': 'cat', 'image': 'http://example.com/c1.jpg'},
    {'label': 'dog', 'image': 'http://example.com/d1.jpg'},
    ...
]
  

запустите это, чтобы создать new_label ключ и извлечь имя метки во вложенный dict

 for image in json_file:
    for key in list(image):
        if key == 'Label':
            image['new_label'] = list(image['Label'].keys())[0]
  

вы получите что-то вроде:

'new_label': 'dorsaalinen kallistuskulma'

сохраните новый файл json_file

 import json
with open('data.json', 'w') as outfile:  
    json.dump(json_file, outfile)
  

теперь мы можем использовать gapcv для загрузки и предварительной обработки ваших изображений с url:

 images = Images('my_new_file', 'data.json', config=['image_key=Labeled Data', 'label_key=new_label', 'store', 'resize=(224,224)'])
  

это создаст my_new_file.h5 файл, готовый под вашу модель 🙂

вы также можете использовать get a generator и использовать его для keras:

 # this will stream the data from the `my_new_file.h5` file so you don't overload your memory
images = Images(config=['stream'], augment=['flip=both', 'edge', 'zoom=0.3', 'denoise']) # augment if it's needed if not use just Images(config=['stream']), norm 1.0/255.0 by default.
images.load('my_new_file')

#Metadata

print('images train')
print('Time to load data set:', images.elapsed)
print('Number of images in data set:', images.count)
print('classes:', images.classes)
  

генератор:

 images.split = 0.2
images.minibatch = 32
gap_generator = images.minibatch
X_test, Y_test = images.test
  

Подходящая keras модель:

 model.fit_generator(generator=gap_generator,
                    validation_data=(X_test, Y_test),
                    epochs=epochs,
                    steps_per_epoch=steps_per_epoch)
  

зачем использовать gapcv? ну, это в два раза быстрее подгоняет модель, чем ImageDataGenerator() 🙂

пример в colab

Комментарии:

1. Большое спасибо! Я попробую!

2. Дайте мне знать, как это происходит. Я могу помочь вам заставить это работать!