#java #wordnet
#java #wordnet
Вопрос:
Я хочу проанализировать значение всех существительных в текстовом документе и хочу аннотировать их как объект / местоположение и т.д. (или что-то подобное) Например, если текстовый документ содержит,
Stella went to the kitchen to get a knife.
Мне нужно определить кухню как местоположение, а нож как объект.
На данный момент я использую wordnet Rita с кодом Java и идентифицирую все существительные в текстовом документе и получаю синтаксический набор каждого слова.Но я не знаю, как анализировать каждое значение слова и определять наиболее релевантное значение в соответствии с контекстом и идентифицировать его как объект или местоположение и т.д.
Комментарии:
1. Вы хотите семантически устранить неоднозначность / различать? Если это так, то WordNet сам по себе, вероятно, вам не очень поможет. Вы можете посмотреть, находите ли вы другие слова из родственных слов в контексте слова.
2. Интересно, может ли этот вопрос получить больше внимания в linguistics.stackexchange.com , а именно. linguistics.stackexchange.com/q/870/225
3. То, что вы ищете, называется распознаванием сущностей. Есть несколько вариантов; используйте веб-API для более точного такого OpenCalais или посмотрите, например, на LingPipe, который представляет собой библиотеку, которую вы можете включить в свое программное обеспечение (однако, взгляните на лицензионное соглашение, если вы планируете использовать его в коммерческих целях).
4. Спасибо. Я проверю linguistics.stackexchange.com . И в настоящее время я использую встроенные ворота для идентификации имен пользователей и т.д. Но я хочу перейти к другому методу идентификации существительных-запятых, как в приведенном выше примере.