Вопрос об использовании цитаты и coref для китайского языка

#stanford-nlp #quote

Вопрос:

Я пытаюсь извлечь цитаты и основную информацию из китайских данных, используя StanfordCoreNLP 4.2.0, в дополнение к остальной части конвейера. Я смог заставить tokenize,ssplit,pos,lemma,ner,depparse,kbp работать с этим кодом:

«java -cp » class_path «*; -Xmx» память «g edu.stanford.nlp.конвейер.StanfordCoreNLP -реквизит StanfordCoreNLP-китайский.свойства -потоки » nthreads «-аннотаторы маркируют,ssplit,pos,лемма,ner,depparse,kbp» «-список файлов » список файлов » -Каталог вывода » папка вывода «-Формат вывода xml»

но когда я добавляю coref и/или цитату в аннотаторы, он не выводит никаких файлов (мой текущий вывод-xml, но я также пробовал текст). Я пытался:

токенизация,ssplit,pos,лемма,ner,depparse,kbp,цитата,coref
токенизация,ssplit,pos,лемма,ner,depparse,kbp,цитата
токенизация,ssplit,pos,лемма,ner,depparse,kbp,ядро -ядро.алгоритм нейронный
токенизация,ssplit,pos,лемма,ner,depparse,kbp,coref

И я пробовал каждый из них с помощью синтаксического анализа вместо деппарса. Я не смог заставить аннотатор синтаксического анализа работать даже с помощью только токенизации,ssplit,pos,синтаксического анализа — он ничего не выводит.

Любые советы о том, почему это может произойти, были бы очень признательны!

Вопрос:

Вам также может понравиться

LDAP Java EE, автоматическое заполнение с помощью jquery-ui и объекта json сервлетом?

Apache Beam , имитация внешних клиентов, инициализированных в методе жизненного цикла @Setup DoFn

Какие типы Unity обнуляются?