#nlp #nltk
#nlp #nltk
Вопрос:
Мне нужно извлечь личную информацию о человеке из списка документов и обобщить ее для пользователя. Если есть 2 человека с одинаковым именем, должен быть идентифицирован правильный человек. Если у человека есть псевдоним, его также необходимо идентифицировать. Входными данными для программы могут быть имя человека, адрес, название организации и т.д. Я извлек из текста именованные объекты, такие как person, org, location и т.д., Используя библиотеку NLTK. Результат после извлечения названных объектов указан ниже,
[(‘Майкл’, ‘NNP’, ‘B-ПЕРСОНА’), (‘Джозеф’, ‘NNP’, ‘B-ПЕРСОНА’), (‘Джексон’, ‘NNP’, ‘Я-ПЕРСОНА’), (‘был’, ‘VBD’, ‘O’), (‘родился’, ‘VBN’, ‘O’), (‘в’, ‘В’, ‘O’), (‘Гэри’, ‘ NNP’, ‘B-GPE’), (‘,’, ‘,’, ‘ O’), (‘Indiana’, ‘NNP’, ‘B-GPE’)….
Теперь я хочу извлечь связи между этими объектами.
Ответ №1:
Ваша задача действительно связана с извлечением информации NLP. Взгляните сюда, чтобы получить общее представление, будет лучше. Извлечение информации в Стэнфорде.
Кроме того, если есть повторяющиеся имена, метод с именем Entity linking может решить эту проблему.
Название документов также может помочь в качестве условия, когда вы хотите вывести более точный результат.
Это пример извлечения информации в NLP. Надеюсь, это поможет!