#python
#python
Вопрос:
То, что я попробовал, выглядит следующим образом:
1)
response = urllib2.urlopen(url)
html = response.read()
Таким образом, я не могу открыть URL-адрес в браузере.
2)
webbrowser.open(url)
Таким образом, я не могу получить исходный код URL-адреса.
Итак, как я могу открыть URL-адрес и получить исходный код одновременно?
Спасибо за вашу помощь.
Комментарии:
1. URL-адрес открывается либо вашим браузером, либо Python. Вы не можете сделать и то, и другое за один шаг.
2.
ctrl u
? : p
Ответ №1:
Взгляните на BeautifulSoup: https://www.crummy.com/software/BeautifulSoup /
Вы можете запросить веб-сайт, а затем прочитать исходный код HTML с него:
import requests
from bs4 import BeautifulSoup
r = requests.get(YourURL)
soup = BeautifulSoup(r.content)
print soup.prettify()
Если вы хотите читать JavaScript, загляните в безголовые браузеры.