Извлекать личную информацию о человеке из списка документов и обобщать ее

#nlp #nltk

#nlp #nltk

Вопрос:

Мне нужно извлечь личную информацию о человеке из списка документов и обобщить ее для пользователя. Если есть 2 человека с одинаковым именем, должен быть идентифицирован правильный человек. Если у человека есть псевдоним, его также необходимо идентифицировать. Входными данными для программы могут быть имя человека, адрес, название организации и т.д. Я извлек из текста именованные объекты, такие как person, org, location и т.д., Используя библиотеку NLTK. Результат после извлечения названных объектов указан ниже,

[(‘Майкл’, ‘NNP’, ‘B-ПЕРСОНА’), (‘Джозеф’, ‘NNP’, ‘B-ПЕРСОНА’), (‘Джексон’, ‘NNP’, ‘Я-ПЕРСОНА’), (‘был’, ‘VBD’, ‘O’), (‘родился’, ‘VBN’, ‘O’), (‘в’, ‘В’, ‘O’), (‘Гэри’, ‘ NNP’, ‘B-GPE’), (‘,’, ‘,’, ‘ O’), (‘Indiana’, ‘NNP’, ‘B-GPE’)….

Теперь я хочу извлечь связи между этими объектами.

Ответ №1:

Ваша задача действительно связана с извлечением информации NLP. Взгляните сюда, чтобы получить общее представление, будет лучше. Извлечение информации в Стэнфорде.

Кроме того, если есть повторяющиеся имена, метод с именем Entity linking может решить эту проблему.

Название документов также может помочь в качестве условия, когда вы хотите вывести более точный результат.

Это пример извлечения информации в NLP. Надеюсь, это поможет!

введите описание изображения здесь