#python #http #get #request
Вопрос:
Я хочу отправить запрос GET на веб-сайт в библиотеке запросов на python, но время истекает. Когда я отправляю запрос Get в linux bash (с wget), он отвечает.
Это работает на python:
import requests as req
url = 'https://mkyong.com/computer-tips/how-to-view-http-headers-in-google-chrome/'
content = req.get(url, timeout=30)
print(content)
Это не работает на python (я хочу работать с этой страницей):
import requests as req
url = 'https://sahibinden.com/'
content = req.get(url, timeout=30)
print(content)
Это работает над wget:
[input]
emr@DESKTOP-05BO8UL:~$ wget sahibinden.com
[output]
--2021-09-30 22:09:20-- http://sahibinden.com/
Resolving sahibinden.com (sahibinden.com)... 85.111.30.111
Connecting to sahibinden.com (sahibinden.com)|85.111.30.111|:80... connected.
HTTP request sent, awaiting response... 301 MOVED PERMANENTLY
Location: https://sahibinden.com/ [following]
--2021-09-30 22:09:20-- https://sahibinden.com/
Connecting to sahibinden.com (sahibinden.com)|85.111.30.111|:443... connected.
HTTP request sent, awaiting response... 301 MOVED PERMANENTLY
Location: https://www.sahibinden.com/ [following]
--2021-09-30 22:09:20-- https://www.sahibinden.com/
Resolving www.sahibinden.com (www.sahibinden.com)... 85.153.138.111
Connecting to www.sahibinden.com (www.sahibinden.com)|85.153.138.111|:443... connected.
HTTP request sent, awaiting response... 200
Length: unspecified [text/html]
Saving to: ‘index.html’
index.html [ <=> ] 200.88K --.-KB/s in 0.1s
2021-09-30 22:09:21 (1.31 MB/s) - ‘index.html’ saved [205699]
Ответ №1:
Возможно, вам потребуется предоставить пользовательский агент.
import requests as req
url = 'https://sahibinden.com/'
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_1) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.95 Safari/537.36'}
content = req.get(url, headers=headers, timeout=6)
print(content)
Этот конкретный сервер кажется перегруженным запросами, поэтому, возможно, не сможет вернуть ничего значимого.