Специфичное для NLP извлечение текста

#nlp #text-extraction

Вопрос:

Я должен определить название страны из случайного текста. У меня есть список стран.

Я изо всех сил пытаюсь найти решение, которое может обучать модель в списке стран, и когда я предоставляю случайный текст этой модели в качестве входных данных, он идентифицирует название страны в качестве выходных данных.

например:-

  • «Я живу в Индии» даст «Индию»
  • «Лондон — столица Соединенного Королевства» даст «Соединенное Королевство»

Заранее спасибо.

Комментарии:

1. Это действительно звучит как пикантно

Ответ №1:

В этом случае кажется, что вы сопоставляете текст. Зачем вам нужна модель? Кажется немного излишним.

Если у вас есть список стран, вам следует нормализовать текст

https://www.geeksforgeeks.org/normalizing-textual-data-with-python/

И тогда вы могли бы искать страны в тексте.

https://www.dummies.com/programming/python/how-to-search-within-a-string-in-python/

Вы могли бы использовать определенные методы для сопоставления, такие как расстояние Левестейна, но я не думаю, что для этого необходимо создавать модель.

Комментарии:

1. Привет, мигелик, на самом деле я привел очень счастливый случай в качестве примера. Текст также может быть похож на: Страна загрузкиindiaports, также в них могут быть орфографические ошибки, такие как India