#python #spacy
Вопрос:
Я пытаюсь найти конкретную тему, которая относится к объекту из статьи. Нравится:
text = "Masood Azhar was killed by Imran Raza holding number 03213216544. the news was published on the website on 2021"
who's number is?
text = "Masood Azhar was killed by Imran Raza was living in the USA. the news was published on the website on 2021"
who was living in the USA?
text = "Masood Azhar was killed by Imran Raza and Ghulam Jafari holding CNIC 2652-6523652-8. the news was published on the website on 2021"
who's CNIC is?
Я использовал spacy
из их документации используемые предложения и токенизатор, но я не нашел ничего, что мне нужно, чтобы найти номер, указанный в текстовой переменной, но в этой переменной есть два имени. как я могу узнать, чей это номер между «Масуд Азхар» и «Имран Раза»?
Грамматически это номер масуда азхара, верно?
Но будет много ситуаций, таких как номер, CNIC, адрес между тремя или более лицами. будет CNIC в конце предложения с именем человека в конце и так далее. но моя задача состоит в том, чтобы найти номер, CNIC, адрес и другие данные, связанные между двумя или тремя людьми, которые являются CNIC? чей это номер? чей это адрес? и т.д.
Комментарии:
1. Это звучит как проблема «извлечения отношений». Вам нужно определить номера, которые вас интересуют (я думаю, только CNICs?), а затем выяснить, с кем они связаны. См. Пример проекта и учебник по извлечению связей. github.com/explosion/projects/tree/v3/tutorials/rel_component
2. Я не получаю исходный файл для запуска и получения результата. не могли бы вы, пожалуйста, направить меня к исполняемому файлу, куда я помещу свой текст и получу результат? пожалуйста.