Как получить неотправленный исходный код HTML с помощью Python и Selenium

#python #selenium #selenium-chromedriver

#python #селен #selenium-chromedriver

Вопрос:

Я использую Selenium с Python и хочу получить доступ к простому исходному коду HTML до его анализа и изменения DOM браузером. Я не хочу использовать «driver.page_source», поскольку он возвращает мне DOM после синтаксического анализа, и, например, включаются динамически создаваемые элементы. Я знаю, что мог бы выполнить второй запрос, например, с запросами, но я ищу способ извлечь его без выполнения дополнительного запроса. Есть идеи?

Ответ №1:

Вы можете получить простой исходный код HTML, используя driver.get(f"view-source:{url}") . Затем получите тело исходного кода, используя driver.find_element_by_tag_name('body').text

Комментарии:

1. Спасибо за предложение, но это также выполняет второй запрос. Я надеялся сделать это за один запрос.

2. Нет, это не возможно.