#java #nlp #wordnet #named-entity-recognition #opennlp
#java #nlp #wordnet #распознавание именованных объектов #opennlp
Вопрос:
Я пытался использовать OpenNLP Tools 1.5 из SourceForge для получения именованных объектов из текста. Я нашел файл JWNL при загрузке OpenNLP. Означает ли это, что OpenNLP, в свою очередь, использует WordNet для распознавания именованных объектов. (В частности, означает ли это, что файлы модели имен были сгенерированы с помощью WordNet)?
Ответ №1:
Нет, OpenNLP использует WordNet только для разрешения совместной ссылки, такой как сопоставление «Он» со «Стивом Джонсом» в отдельных предложениях.
WordNet не используется для распознавания именованных объектов. Файлы обучения именованных объектов представляют собой вручную аннотированные поля из различных конференций / тестов, таких как CoNLL.
Ответ №2:
Насколько я знаю, OpenNLP использует пакет maximum entropy для предоставления всех своих статистических моделей — тегов pos, обнаружения предложений и даже токенизации. Интеграция Wordnet не является частью OpenNLP, поэтому я думаю, что ее функции не использовались в моделях обучения.