#python #machine-learning #computer-vision #feature-engineering
#python #машинное обучение #компьютерное зрение #разработка функций
Вопрос:
У меня есть словарь, в котором хранятся данные цветных изображений для 4 классов. Каждое изображение 256* 256 * 3 В моем словаре есть 4 ключа с именами самолет, птица, собака и кошка. Каждый из этих ключей в словаре имеет 50 массивов размерности 256* 256* 3 (50 изображений каждого класса в виде трехмерного массива, всего 200 изображений). Я хочу преобразовать эту структуру данных в 200 * 3* 256* 256 сформируйте массив, который извлек метку из ключа словаря. Как я могу добиться этого самым простым способом? Я попробовал numpy reshape, но не сработало.
Комментарии:
1. Вместо описания ваших данных, можете ли вы показать нам хотя бы небольшую часть структуры данных в коде?
2. @LaurenBoland Я думал, что это было довольно ясно, если честно.
3. Данные и код намного понятнее, если вы на самом деле их показываете, а не описываете словами, которые могут быть оставлены для интерпретации. Но я с нетерпением жду вашего ответа. 🙂
4. @LaurenBoland Поскольку он многомерный, я понятия не имел, как его здесь представить, поэтому я попытался объяснить это, как указано выше. Я могу показать вам 2-D, но не уверен в 3-D, или в этом случае я должен преобразовать его в 4-D.
Ответ №1:
Итак, я предполагаю, что ваша настройка данных выглядит примерно так (очевидно, с реальными данными вместо случайных данных):
classes = ["plane", "bird", "dog", "cat"]
images = {
k: [np.random.uniform(size=(256, 256, 3))
for _ in range(50)]
for k in classes
}
Что мы можем сделать, так это следующее:
X = np.concatenate([images[k] for k in classes], axis=0)
y = np.concatenate([[i] * len(images[k]) for i, k in enumerate(classes)])
Я полагаю, это дает то, что вы хотите:
>>> X.shape
(200, 256, 256, 3)
>>> y.shape
(200,)
Комментарии:
1. Большое вам спасибо, это работает, хотя один последующий вопрос вместо (200, 256, 256, 3), можно ли было бы иметь его как (200,3, 256,256).
2. @atp Проверьте
np.swapaxes
.