Как интерпретировать документацию tensorflow.keras.preprocessing.image_dataset_from_directory?

#tensorflow #image-processing #keras #supervised-learning

Вопрос:

Эта функция https://keras.io/api/preprocessing/image/#image_dataset_from_directory-function
требуется категориальный вектор для одного из его входных данных в моем конкретном случае использования.

Как мне превратить список целых чисел или строк в категориальный вектор?

В частности, в нем говорится: метки: либо «выводимые» (метки создаются из структуры каталогов), Нет (без меток), либо список/кортеж целых меток того же размера, что и количество файлов изображений, найденных в каталоге. Метки должны быть отсортированы в соответствии с буквенно-цифровым порядком путей к файлам изображений (полученным с помощью os.walk(каталог) в Python). label_mode: — ‘int’: означает, что метки кодируются как целые числа (например.g. для потери разреженной категории_crossentropy). — «категориальный» означает, что метки кодируются как категориальный вектор (например, для категориальной потери перекрестной энтропии). — «двоичный» означает, что метки (их может быть только 2) кодируются как скаляры float32 со значениями 0 или 1 (например, для binary_crossentropy). — Нет (без этикеток).

Так что мне нужен такой список/кортеж, как этот…

 labels = [(filename, label), (filename, label)....]
 

упорядочены в соответствии с буквенно-цифровым порядком имен файлов или….

 labels = [label, label,....]
 

снова организовано, как указано выше?