Как обнаружить именованные объекты

#java #entity #nlp #semantic-web

#java #сущность #nlp #семантическая сеть

Вопрос:

У меня есть список именованных объектов. Я хотел бы извлечь перечисленные именованные объекты из определенного текстового файла с некоторыми библиотеками Java.

Что я хочу сделать, так это;

  • «Валюты» должны быть обнаружены, даже если список включает только «Currency». И наоборот, должна быть обнаружена «страна ОЭСР», даже если список включает только «страны ОЭСР».
  • «рекомендательная система» должна быть обнаружена, если список включает только «рекомендательную систему» и наоборот.
  • «экономическая теория покупателя» должна быть обнаружена, если список включает только «экономическую теорию покупателя» и наоборот.

Я пробовал GATE tools, но это не сработало должным образом. Как я могу это сделать? Если у вас есть какие-либо предложения, пожалуйста, дайте мне знать.

Ответ №1:

Вы можете использовать Illinois-NER, но вам нужно снабдить образец обучающих данных желаемой аннотацией и снова обучить модель, поскольку ваши желаемые метки is отличаются от текущих меток: http://cogcomp.cs.illinois.edu/page/software_view/4