#python #pandas #dataframe #tensorflow #keras
#python #pandas #фрейм данных #tensorflow #keras
Вопрос:
Я пытаюсь создать модель для прогнозирования того, должен ли быть пробел после определенной строки. Этот файл Google Colab содержит мой код без требуемой предварительной обработки с очень небольшими выборками данных, которые соответствуют формату, в котором данные, которые будут использоваться для обучения.
https://colab.research.google.com/drive/1qBUdAo2FTG8gLwlXjo1Ba7an3mBvCJF_?usp=sharing
Единица в «метках» указывает, что после соответствующей строки должен быть пробел, а ноль, которого не должно быть.
Полная ошибка:
UnimplementedError: 2 root error(s) found.
(0) Unimplemented: Cast string to float is not supported
[[node sequential_5/Cast (defined at <ipython-input-34-23cc1e9dc370>:11) ]]
(1) Cancelled: Function was canceled before it was started
0 successful operations.
0 derived errors ignored. [Op:__inference_train_function_14019]
Заранее благодарим вас за ваши решения.
Ответ №1:
Основываясь на вашей модели — у вас должен быть целочисленный тензор в качестве входных данных (ваш первый слой — это слой встраивания, который ожидает целочисленные значения).
Насколько я понимаю, у вас есть список всех возможных входных строк в словаре. Если это так — вы должны отправить целочисленные коды входной строки (а не саму строку). В вашем случае:
vocab = [0, 1, 2, 3, 4, 5, 6]
где каждый код является индексом в вашем словаре.
Однако использовать LSTM для этой цели не имеет смысла.