Семантический анализ слов в текстовом документе с использованием wordnet

#java #wordnet

#java #wordnet

Вопрос:

Я хочу проанализировать значение всех существительных в текстовом документе и хочу аннотировать их как объект / местоположение и т.д. (или что-то подобное) Например, если текстовый документ содержит,

       Stella went to the kitchen to get a knife.
  

Мне нужно определить кухню как местоположение, а нож как объект.

На данный момент я использую wordnet Rita с кодом Java и идентифицирую все существительные в текстовом документе и получаю синтаксический набор каждого слова.Но я не знаю, как анализировать каждое значение слова и определять наиболее релевантное значение в соответствии с контекстом и идентифицировать его как объект или местоположение и т.д.

Комментарии:

1. Вы хотите семантически устранить неоднозначность / различать? Если это так, то WordNet сам по себе, вероятно, вам не очень поможет. Вы можете посмотреть, находите ли вы другие слова из родственных слов в контексте слова.

2. Интересно, может ли этот вопрос получить больше внимания в linguistics.stackexchange.com , а именно. linguistics.stackexchange.com/q/870/225

3. То, что вы ищете, называется распознаванием сущностей. Есть несколько вариантов; используйте веб-API для более точного такого OpenCalais или посмотрите, например, на LingPipe, который представляет собой библиотеку, которую вы можете включить в свое программное обеспечение (однако, взгляните на лицензионное соглашение, если вы планируете использовать его в коммерческих целях).

4. Спасибо. Я проверю linguistics.stackexchange.com . И в настоящее время я использую встроенные ворота для идентификации имен пользователей и т.д. Но я хочу перейти к другому методу идентификации существительных-запятых, как в приведенном выше примере.