Функция CudnnConvolutionBackward вернула недопустимый градиент с индексом 1 — got [294, 592, 1, 1], но ожидаемая форма, совместимая с [294, 768, 1, 1]

#pytorch #пыторч Вопрос: Я работаю над проектом pytorch (torch = 1.2.0) с учетом сокращения CNN. Я удалил несколько фильтров из модели и попытался переобучить уменьшенную модель. Однако мой код выходит…

Продолжить чтениеФункция CudnnConvolutionBackward вернула недопустимый градиент с индексом 1 — got [294, 592, 1, 1], но ожидаемая форма, совместимая с [294, 768, 1, 1]

Ошибка типа: Слой input_spec должен быть экземпляром InputSpec. Получено: InputSpec(форма=(Нет, 128, 768), ndim=3)

#python #tensorflow #keras #deep-learning #bert-language-model Вопрос: Я пытаюсь использовать предварительно обученную модель БЕРТА для многоклассовой классификации (из 3 классов). Вот моя функция для использования модели, а также добавлены некоторые дополнительные…

Продолжить чтениеОшибка типа: Слой input_spec должен быть экземпляром InputSpec. Получено: InputSpec(форма=(Нет, 128, 768), ndim=3)

модель берта, показывающая ошибку типа: Слой input_spec, должен быть экземпляром InputSpec. Получено: спецификация ввода(форма=(Нет, 55, 768), ndim=3)

#keras #android-intent #classification #bert-language-model Вопрос: Я пытаюсь использовать предварительно подготовленную модель Берта для классификации намерений. вот мой код в jupyter notebok. class DataPreparation: text_column = "text" label_column = "intent" def…

Продолжить чтениемодель берта, показывающая ошибку типа: Слой input_spec, должен быть экземпляром InputSpec. Получено: спецификация ввода(форма=(Нет, 55, 768), ndim=3)

Ожидаемый 4-мерный ввод для 4-мерного веса [192, 768, 1, 1], но вместо этого получил 2-мерный ввод размера [50, 1000]

#python #deep-learning #pytorch #torch Вопрос: Я пытаюсь модифицировать Inception v3, предварительно обученный в pytorch, чтобы иметь несколько входов. ( 4 вывода точно). Я получаю эту ошибку: Ожидаемый 4-мерный ввод для…

Продолжить чтениеОжидаемый 4-мерный ввод для 4-мерного веса [192, 768, 1, 1], но вместо этого получил 2-мерный ввод размера [50, 1000]