Преобразование словаря в многомерный массив?

#python #machine-learning #computer-vision #feature-engineering

#python #машинное обучение #компьютерное зрение #разработка функций

Вопрос:

У меня есть словарь, в котором хранятся данные цветных изображений для 4 классов. Каждое изображение 256* 256 * 3 В моем словаре есть 4 ключа с именами самолет, птица, собака и кошка. Каждый из этих ключей в словаре имеет 50 массивов размерности 256* 256* 3 (50 изображений каждого класса в виде трехмерного массива, всего 200 изображений). Я хочу преобразовать эту структуру данных в 200 * 3* 256* 256 сформируйте массив, который извлек метку из ключа словаря. Как я могу добиться этого самым простым способом? Я попробовал numpy reshape, но не сработало.

Комментарии:

1. Вместо описания ваших данных, можете ли вы показать нам хотя бы небольшую часть структуры данных в коде?

2. @LaurenBoland Я думал, что это было довольно ясно, если честно.

3. Данные и код намного понятнее, если вы на самом деле их показываете, а не описываете словами, которые могут быть оставлены для интерпретации. Но я с нетерпением жду вашего ответа. 🙂

4. @LaurenBoland Поскольку он многомерный, я понятия не имел, как его здесь представить, поэтому я попытался объяснить это, как указано выше. Я могу показать вам 2-D, но не уверен в 3-D, или в этом случае я должен преобразовать его в 4-D.

Ответ №1:

Итак, я предполагаю, что ваша настройка данных выглядит примерно так (очевидно, с реальными данными вместо случайных данных):

 classes = ["plane", "bird", "dog", "cat"]
images = {
     k: [np.random.uniform(size=(256, 256, 3))
         for _ in range(50)]
     for k in classes
}
  

Что мы можем сделать, так это следующее:

 X = np.concatenate([images[k] for k in classes], axis=0)
y = np.concatenate([[i] * len(images[k]) for i, k in enumerate(classes)])
  

Я полагаю, это дает то, что вы хотите:

 >>> X.shape
(200, 256, 256, 3)

>>> y.shape
(200,)
  

Комментарии:

1. Большое вам спасибо, это работает, хотя один последующий вопрос вместо (200, 256, 256, 3), можно ли было бы иметь его как (200,3, 256,256).

2. @atp Проверьте np.swapaxes .