Использует ли OpenNLP WordNet под капотом для распознавания именованных объектов

#java #nlp #wordnet #named-entity-recognition #opennlp

#java #nlp #wordnet #распознавание именованных объектов #opennlp

Вопрос:

Я пытался использовать OpenNLP Tools 1.5 из SourceForge для получения именованных объектов из текста. Я нашел файл JWNL при загрузке OpenNLP. Означает ли это, что OpenNLP, в свою очередь, использует WordNet для распознавания именованных объектов. (В частности, означает ли это, что файлы модели имен были сгенерированы с помощью WordNet)?

Ответ №1:

Нет, OpenNLP использует WordNet только для разрешения совместной ссылки, такой как сопоставление «Он» со «Стивом Джонсом» в отдельных предложениях.

WordNet не используется для распознавания именованных объектов. Файлы обучения именованных объектов представляют собой вручную аннотированные поля из различных конференций / тестов, таких как CoNLL.

Источник:http://opennlp.sourceforge.net/README.html

Ответ №2:

Насколько я знаю, OpenNLP использует пакет maximum entropy для предоставления всех своих статистических моделей — тегов pos, обнаружения предложений и даже токенизации. Интеграция Wordnet не является частью OpenNLP, поэтому я думаю, что ее функции не использовались в моделях обучения.