Solr — исправление OpenNLP 2899, время, затраченное trainall.sh ? и неудачный набор тестов?

#ant #solr #lucene #opennlp

#ant #solr #lucene #opennlp

Вопрос:

Я следую инструкциям, приведенным в — https://wiki.apache.org/solr/OpenNLP

Для тестирования на английском языке: до фиксации LUCENE-2899:

  1. извлеките последнюю магистраль или ветку 4.0
  2. примените последний патч LUCENE-2899
  3. компилировать ant
  4. cd solr / contrib / opennlp / src/ тестовые файлы / обучение
  5. выполнить ‘bin/trainall.sh ‘это создаст двоичные файлы, которые будут включены в дистрибутив при фиксации.
  6. Теперь перейдите в trunk-dir / solr и запустите ‘ant test-contrib’. Он компилирует код OpenNLP lucene и solr с библиотеками OpenNLP и использует небольшие файлы моделей.

Я выполнил шаги, на шаге 5, я не уверен, сколько времени это займет? поскольку он работает более 12 часов..

или я могу выполнить шаг 6 параллельно? Я попробовал шаг 5 и 6 вместе, затем появляется ошибка; описание указано ниже…

[junit4] Сводка тестов: 2 набора, 0 тестов, 2 ошибки уровня набора

СБОЙ СБОРКИ /home/svn2/solr/build.xml:201: При выполнении этой строки произошла следующая ошибка: /home/svn2/solr/common-build.xml:417: При выполнении этой строки произошла следующая ошибка: /home/svn2/solr/common-build.xml:449: При выполнении этой строки произошла следующая ошибка: /home/svn2/lucene/common-build.xml:1250: При выполнении этой строки произошла следующая ошибка: /home/svn2/lucene/common-build.xml:893: Были сбои в тестировании: 2 набора, 0тесты, 2 ошибки уровня набора

Пожалуйста, предложите. Моя цель высокого уровня — индексировать корпусы предложение за предложением. Заранее спасибо!

Ответ №1:

Скрипт #!/usr/bin/env находится наверху, что также привело к кажущемуся длительному времени выполнения в моей системе (на самом деле ничего не выполняется, о чем свидетельствует отсутствие сгенерированных тестовых файлов). Замена этого на #!/bin/bash быстрое решение проблемы (время выполнения несколько секунд).