#python-3.x #machine-learning #bert-language-model #huggingface-transformers #document-classification
#python-3.x #машинное обучение #bert-language-model #huggingface-трансформеры #классификация документов
Вопрос:
Я пытался использовать https://github.com/microsoft/unilm/tree/master/layoutlm для целей классификации документов, но постоянно получал сообщение «Ошибка: невозможно загрузить веса из файла контрольной точки pytorch».
Может кто-нибудь помочь мне запустить и работать с layoutLM.
Конфигурация / Версии:
- Windows 10
- Python — 3.6.5
- huggingface-трансформеры — 3.1.0
- pytorch — 1.5.0
- tensorflow — 2.3.1
команда для запуска кода:
python run_classification.py --data_dir C:UsersDownloadsunilm-masterunilm-masterlayoutlmexamplesclassificationdata --model_type layoutlm --output_dir C:UsersDownloadsunilm-masterunilm-masterlayoutlmexamplesclassificationdata --do_eval --model_name_or_path
Я полагаю, что есть некоторые проблемы с командой --model_name_or_path
, я попробовал вышеуказанный метод и попытался загрузить файл pytorch_model.bin для layoutlm и указать его в качестве аргумента для --model_name_or_path
, но безрезультатно.
C:UsersDownloadsunilm-masterunilm-masterlayoutlmexamplesclassificationmodelpytorch_model.bin.
А также я сомневаюсь, что это из-за несоответствия между поддержкой Transformer и поддержкой layoutlm (связанной с версией tranformers 3.1.0 или 2.0.0)?
Может кто-нибудь помочь мне ускорить работу с layoutLM.
Помощь приветствуется.
Комментарии:
1. Я не пробовал всю вашу команду, а
model_name_or_path
просто каталог, содержащий файл весов. Т.е. C:UsersDownloadsunilm-masterunilm-masterlayoutlmexamplesclassificationmodel2. Я также опробовал это, поместив файл pytorch_model.bin в каталог, но это не сработало.
3. Но сообщение об ошибке должно измениться. Вы также разместили config.json в этом каталоге?
4. Да, я разместил config.json и vocab.txt также