#python-3.x #tensorflow #keras #multiclass-classification
#python-3.x #тензорный поток #keras #мультикласс-классификация
Вопрос:
Я работаю над небольшим NN в keras для задачи классификации нескольких классов. У меня 9 разных меток, и моих функций тоже 9.
Мои обучающие / тестовые формы следующие:
Sets shape:
x_train shape: (7079, 9)
y_train shape: (7079,)
x_test shape: (7079, 9)
y_test shape: (7079,)
Но когда я пытаюсь сделать их категоричными:
y_train = tf.keras.utils.to_categorical(y_train, num_classes=9)
y_test = tf.keras.utils.to_categorical(y_test, num_classes=9)
Я получаю следующую ошибку:
IndexError: index 9 is out of bounds for axis 1 with size 9
Здесь больше информации о y_train
print(np.unique(y_train)) # [1. 2. 3. 4. 5. 6. 7. 8. 9.]
print(len(np.unique(y_train))) # 9
Кто-нибудь знает, в чем проблема?
Ответ №1:
Форма y_train
есть 1D
. Вы должны сделать его одноразовым. Что-то вроде
y_train = tf.keras.utils.to_categorical(y_train , num_classes=9)
И то же самое касается y_test
тоже.
Обновить
Согласно документу,
tf.keras.utils.to_categorical(y, num_classes=None, dtype="float32")
Здесь y: вектор класса, который нужно преобразовать в матрицу (целые числа от 0
до num_classes
). Как и в вашем случае, y_train
это что-то вроде [1,2,..]
. Вам нужно сделать следующее:
y_train = tf.keras.utils.to_categorical(y_train - 1, num_classes=9)
Вот пример для справки. Если мы сделаем
class_vector = np.array([1, 1, 2, 3, 5, 1, 4, 2])
print(class_vector)
output_matrix = tf.keras.utils.to_categorical(class_vector,
num_classes = 5, dtype ="float32")
print(output_matrix)
[1 1 2 3 5 1 4 2]
---------------------------------------------------------------------------
IndexError Traceback (most recent call last)
<ipython-input-15-69c8be7a0f1a> in <module>()
6 print(class_vector)
7
----> 8 output_matrix = tf.keras.utils.to_categorical(class_vector, num_classes = 5, dtype ="float32")
9 print(output_matrix)
/usr/local/lib/python3.7/dist-packages/tensorflow/python/keras/utils/np_utils.py in to_categorical(y, num_classes, dtype)
76 n = y.shape[0]
77 categorical = np.zeros((n, num_classes), dtype=dtype)
---> 78 categorical[np.arange(n), y] = 1
79 output_shape = input_shape (num_classes,)
80 categorical = np.reshape(categorical, output_shape)
IndexError: index 5 is out of bounds for axis 1 with size 5
Чтобы решить эту проблему, мы преобразуем данные в формат с нулевым значением.
output_matrix = tf.keras.utils.to_categorical(class_vector - 1,
num_classes = 5, dtype ="float32")
print(output_matrix)
[[1. 0. 0. 0. 0.]
[1. 0. 0. 0. 0.]
[0. 1. 0. 0. 0.]
[0. 0. 1. 0. 0.]
[0. 0. 0. 0. 1.]
[1. 0. 0. 0. 0.]
[0. 0. 0. 1. 0.]
[0. 1. 0. 0. 0.]]
Комментарии:
1. дайте мне знать, работает ли это для вас или нет. Хотя это должно быть.
2. Теперь он снова жалуется: IndexError: индекс 9 выходит за пределы оси 1 с размером 9
3. Можете ли вы добавить некоторую информацию о вашем
x_train
иy_trian
?4. Хорошо, пожалуйста, обновите свой вопрос с помощью последней обратной трассировки. Это было бы намного понятнее.
5. Можете ли вы попробовать это
..to_categorical(y_train - 1, num_classes=9)