#stanford-nlp #quote
Вопрос:
Я пытаюсь извлечь цитаты и основную информацию из китайских данных, используя StanfordCoreNLP 4.2.0, в дополнение к остальной части конвейера. Я смог заставить tokenize,ssplit,pos,lemma,ner,depparse,kbp работать с этим кодом:
«java -cp » class_path «*; -Xmx» память «g edu.stanford.nlp.конвейер.StanfordCoreNLP -реквизит StanfordCoreNLP-китайский.свойства -потоки » nthreads «-аннотаторы маркируют,ssplit,pos,лемма,ner,depparse,kbp» «-список файлов » список файлов » -Каталог вывода » папка вывода «-Формат вывода xml»
но когда я добавляю coref и/или цитату в аннотаторы, он не выводит никаких файлов (мой текущий вывод-xml, но я также пробовал текст). Я пытался:
- токенизация,ssplit,pos,лемма,ner,depparse,kbp,цитата,coref
- токенизация,ssplit,pos,лемма,ner,depparse,kbp,цитата
- токенизация,ssplit,pos,лемма,ner,depparse,kbp,ядро -ядро.алгоритм нейронный
- токенизация,ssplit,pos,лемма,ner,depparse,kbp,coref
И я пробовал каждый из них с помощью синтаксического анализа вместо деппарса. Я не смог заставить аннотатор синтаксического анализа работать даже с помощью только токенизации,ssplit,pos,синтаксического анализа — он ничего не выводит.
Любые советы о том, почему это может произойти, были бы очень признательны!