#mozilla-deepspeech
#mozilla-deepspeech
Вопрос:
Я пытаюсь создать бомбардира проекта DeepSpeech-Polyglot. Я следил за каждым шагом документации, но когда я запускаю:
python3 /DeepSpeech/data/lm/generate_lm.py --input_txt /DeepSpeech/data_prepared/texts/${LANGUAGE}/clean_vocab.txt --output_dir /DeepSpeech/data_prepared/texts/${LANGUAGE}/ --top_k 500000 --kenlm_bins /DeepSpeech/native_client/kenlm/build/bin/ --arpa_order 5 --max_arpa_memory "85%" --arpa_prune "0|0|1" --binary_a_bits 255 --binary_q_bits 8 --binary_type trie --discount_fallback
Я получаю следующую ошибку:
Saving top 500000 words ...
Calculating word statistics ...
Your text file has 202185630 words in total
It has 2106729 unique words
Your top-500000 words are 98.7433 percent of all words
Your most common word "die" occurred 7853080 times
The least common word in your top-k is "adamantium" with 5 times
The first word with 6 occurrences is "begibst" at place 448270
Creating ARPA file ...
=== 1/5 Counting and sorting n-grams ===
Reading /DeepSpeech/data_prepared/texts/de/lower.txt.gz
----5---10---15---20---25---30---35---40---45---50---55---60---65---70---75---80---85---90---95--100
Traceback (most recent call last):
File "/DeepSpeech/data/lm/generate_lm.py", line 210, in <module>
main()
File "/DeepSpeech/data/lm/generate_lm.py", line 201, in main
build_lm(args, data_lower, vocab_str)
File "/DeepSpeech/data/lm/generate_lm.py", line 97, in build_lm
subprocess.check_call(subargs)
File "/usr/lib/python3.6/subprocess.py", line 311, in check_call
raise CalledProcessError(retcode, cmd)
subprocess.CalledProcessError: Command '['/DeepSpeech/native_client/kenlm/build/bin/lmplz', '--order', '5', '--temp_prefix', '/DeepSpeech/data_prepared/texts/de/', '--memory', '85%', '--text', '/DeepSpeech/data_prepared/texts/de/lower.txt.gz', '--arpa', '/DeepSpeech/data_prepared/texts/de/lm.arpa', '--prune', '0', '0', '1', '--discount_fallback']' died with <Signals.SIGSEGV: 11>.
Я использую эту документацию: https://gitlab.com/Jaco-Assistant/deepspeech-polyglot
Я благодарен за каждый намек.
Ответ №1:
Это обсуждалось в беседе DeepSpeech.
По сути, ваш KenLM установлен неправильно. Найдите просто ошибку в Google, и вы обнаружите, что вам нужно переустановить и проверить свою среду.
Комментарии:
1.Извините, но я не понимаю ответа на Discourse. Я попытался переустановить KenLM следующим образом:
git clone https://github.com/kpu/kenlm
cd kenlm
mkdir build
cd build
apt install build-essential cmake libboost-system-dev libboost-thread-dev libboost-program-options-dev libboost-test-dev libeigen3-dev zlib1g-dev libbz2-dev liblzma-dev
cmake ..
make -j 4
чтобы убедиться, что я ничего не пропустил, я также добавилpip install https://github.com/kpu/kenlm/archive/master.zip
, что он всегда устанавливаетсяkenlm-0.0.0
, это нормально или я что-то напутал?2. Ах, не используйте версию pip. Это определенно проблема. Вам придется создать его самостоятельно, попробуйте это: medium.com/tekraze /…