#nlp #text-extraction
Вопрос:
Я должен определить название страны из случайного текста. У меня есть список стран.
Я изо всех сил пытаюсь найти решение, которое может обучать модель в списке стран, и когда я предоставляю случайный текст этой модели в качестве входных данных, он идентифицирует название страны в качестве выходных данных.
например:-
- «Я живу в Индии» даст «Индию»
- «Лондон — столица Соединенного Королевства» даст «Соединенное Королевство»
Заранее спасибо.
Комментарии:
1. Это действительно звучит как пикантно
Ответ №1:
В этом случае кажется, что вы сопоставляете текст. Зачем вам нужна модель? Кажется немного излишним.
Если у вас есть список стран, вам следует нормализовать текст
https://www.geeksforgeeks.org/normalizing-textual-data-with-python/
И тогда вы могли бы искать страны в тексте.
https://www.dummies.com/programming/python/how-to-search-within-a-string-in-python/
Вы могли бы использовать определенные методы для сопоставления, такие как расстояние Левестейна, но я не думаю, что для этого необходимо создавать модель.
Комментарии:
1. Привет, мигелик, на самом деле я привел очень счастливый случай в качестве примера. Текст также может быть похож на: Страна загрузкиindiaports, также в них могут быть орфографические ошибки, такие как India