Вопрос об использовании цитаты и coref для китайского языка

#stanford-nlp #quote

Вопрос:

Я пытаюсь извлечь цитаты и основную информацию из китайских данных, используя StanfordCoreNLP 4.2.0, в дополнение к остальной части конвейера. Я смог заставить tokenize,ssplit,pos,lemma,ner,depparse,kbp работать с этим кодом:

«java -cp » class_path «*; -Xmx» память «g edu.stanford.nlp.конвейер.StanfordCoreNLP -реквизит StanfordCoreNLP-китайский.свойства -потоки » nthreads «-аннотаторы маркируют,ssplit,pos,лемма,ner,depparse,kbp» «-список файлов » список файлов » -Каталог вывода » папка вывода «-Формат вывода xml»

но когда я добавляю coref и/или цитату в аннотаторы, он не выводит никаких файлов (мой текущий вывод-xml, но я также пробовал текст). Я пытался:

  • токенизация,ssplit,pos,лемма,ner,depparse,kbp,цитата,coref
  • токенизация,ssplit,pos,лемма,ner,depparse,kbp,цитата
  • токенизация,ssplit,pos,лемма,ner,depparse,kbp,ядро -ядро.алгоритм нейронный
  • токенизация,ssplit,pos,лемма,ner,depparse,kbp,coref

И я пробовал каждый из них с помощью синтаксического анализа вместо деппарса. Я не смог заставить аннотатор синтаксического анализа работать даже с помощью только токенизации,ssplit,pos,синтаксического анализа — он ничего не выводит.

Любые советы о том, почему это может произойти, были бы очень признательны!