Ошибка модели Microsoft LayoutLM с huggingface

#python-3.x #machine-learning #bert-language-model #huggingface-transformers #document-classification

#python-3.x #машинное обучение #bert-language-model #huggingface-трансформеры #классификация документов

Вопрос:

Я пытался использовать https://github.com/microsoft/unilm/tree/master/layoutlm для целей классификации документов, но постоянно получал сообщение «Ошибка: невозможно загрузить веса из файла контрольной точки pytorch».

Может кто-нибудь помочь мне запустить и работать с layoutLM.

Конфигурация / Версии:

  • Windows 10
  • Python — 3.6.5
  • huggingface-трансформеры — 3.1.0
  • pytorch — 1.5.0
  • tensorflow — 2.3.1

команда для запуска кода:

 python run_classification.py --data_dir C:UsersDownloadsunilm-masterunilm-masterlayoutlmexamplesclassificationdata --model_type layoutlm --output_dir C:UsersDownloadsunilm-masterunilm-masterlayoutlmexamplesclassificationdata --do_eval --model_name_or_path
  

Я полагаю, что есть некоторые проблемы с командой --model_name_or_path , я попробовал вышеуказанный метод и попытался загрузить файл pytorch_model.bin для layoutlm и указать его в качестве аргумента для --model_name_or_path , но безрезультатно.
C:UsersDownloadsunilm-masterunilm-masterlayoutlmexamplesclassificationmodelpytorch_model.bin.

А также я сомневаюсь, что это из-за несоответствия между поддержкой Transformer и поддержкой layoutlm (связанной с версией tranformers 3.1.0 или 2.0.0)?

Может кто-нибудь помочь мне ускорить работу с layoutLM.

Помощь приветствуется.

Комментарии:

1. Я не пробовал всю вашу команду, а model_name_or_path просто каталог, содержащий файл весов. Т.е. C:UsersDownloadsunilm-masterunilm-masterlayoutlmexamplesclassificationmodel

2. Я также опробовал это, поместив файл pytorch_model.bin в каталог, но это не сработало.

3. Но сообщение об ошибке должно измениться. Вы также разместили config.json в этом каталоге?

4. Да, я разместил config.json и vocab.txt также