#python #web-scraping
Вопрос:
Я строю модель классификации текста, и иногда некоторые слова отсутствуют в словарном запасе(OOV). Эти слова могут быть названиями компаний, могут быть сленговыми или просто неверно набранными или чем-то еще вообще.
Чтобы повысить производительность моей модели классификации текста, мне нужно найти описание/текст/статьи, содержащие эти слова, с помощью веб-скрейпинга.
Исходя из моего ограниченного опыта работы с веб-скребком, я понимаю, что могу это сделать, если уже знаю, с какого сайта мне нужно соскоблить. Как мне искать описание/текст/статьи для определенного слова, не имея в виду конкретный веб-сайт?