#python #automation
#python #автоматизация
Вопрос:
Я специально смотрю на веб-сайт ReferenceUSA. Чтобы загрузить информацию, нужно вручную выбрать все элементы, затем нажать загрузить, а затем на другой странице нажать, чтобы сгенерировать файл CSV. Есть ли способ автоматизировать этот процесс?
Комментарии:
1. Какой-либо код или исследование до сих пор?
2. Посмотрите на веб-очистку, анализаторы HMTL (
lxml
иBeatifulSoup
) и, возможно, модуль Pythonmechanize
. Или покажите нам свой код.3. Спасибо, я заглянул в Beautiful Soup, но не понимаю, как это поможет мне сгенерировать CSV-файлы, хотя теоретически я должен каким-то образом иметь возможность копировать таблицы данных, уже находящиеся на странице (хотя это кажется неэффективным).
4. @numbersloth Ну, ваш вопрос был слишком общим без каких-либо попыток кода, поэтому я просто бросил вам несколько вещей, которые могут быть актуальны в подобных случаях.
Ответ №1:
Вы могли бы попробовать Selenium, вот пример, чтобы открыть веб-страницу и нажать кнопку.
>>> from selenium import webdriver
>>> browser = webdriver.Chrome() ## now web browser opened
>>> browser.get("https://www.python.org") ## now python.org web page opened
Есть кнопка «ПЕРЕЙТИ», исходный код ее страницы выглядит следующим образом:
button type="submit" name="submit" id="submit" class="search-button"...
Теперь нажмите эту кнопку
>>> browser.find_element_by_id("submit").click()