Скрипт для загрузки сгенерированного вручную файла Excel на справочный веб-сайт?

#python #automation

#python #автоматизация

Вопрос:

Я специально смотрю на веб-сайт ReferenceUSA. Чтобы загрузить информацию, нужно вручную выбрать все элементы, затем нажать загрузить, а затем на другой странице нажать, чтобы сгенерировать файл CSV. Есть ли способ автоматизировать этот процесс?

Комментарии:

1. Какой-либо код или исследование до сих пор?

2. Посмотрите на веб-очистку, анализаторы HMTL ( lxml и BeatifulSoup ) и, возможно, модуль Python mechanize . Или покажите нам свой код.

3. Спасибо, я заглянул в Beautiful Soup, но не понимаю, как это поможет мне сгенерировать CSV-файлы, хотя теоретически я должен каким-то образом иметь возможность копировать таблицы данных, уже находящиеся на странице (хотя это кажется неэффективным).

4. @numbersloth Ну, ваш вопрос был слишком общим без каких-либо попыток кода, поэтому я просто бросил вам несколько вещей, которые могут быть актуальны в подобных случаях.

Ответ №1:

Вы могли бы попробовать Selenium, вот пример, чтобы открыть веб-страницу и нажать кнопку.

 >>> from selenium import webdriver
>>> browser = webdriver.Chrome()  ## now web browser opened
>>> browser.get("https://www.python.org")  ## now python.org web page opened
  

Есть кнопка «ПЕРЕЙТИ», исходный код ее страницы выглядит следующим образом:

 button type="submit" name="submit" id="submit" class="search-button"... 
  

Теперь нажмите эту кнопку

 >>> browser.find_element_by_id("submit").click()