#python #parsing #request #python-requests #instagram
#python #синтаксический анализ #запрос #python-запросы #Instagram
Вопрос:
Я написал парсер для Instagram posts, все отлично работает на локальном компьютере.
Код:
import requests
session = requests.Session()
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.125 Safari/537.36'
}
session.headers.update(headers)
url = 'https://www.instagram.com/p/BwxCPidhe0V/'
response = session.get(url)
if response.history:
print("Request was redirected")
for resp in response.history:
print(resp.status_code, resp.url)
print("Final destination:")
print(response.status_code, response.url)
else:
print("Request was not redirected")
При выполнении этого кода мой запрос не перенаправляется на страницу авторизации https://www.instagram.com/accounts/login/?next=/p/BwxCPidhe0V /
Но когда я загружаю код для любого хостинга (Heroku, repl.it , pythonanywhere), мой запрос перенаправляется на страницу авторизации.
Как можно реализовать обход этой системы, чтобы при запросе через хостинг он не перенаправлялся на страницу авторизации?
Предпочтительно использовать библиотеку стандартных запросов python, а не solonium
Песочница:https://repl.it/@briler/bypass-Instagram-parsing-protection#main.py
Комментарии:
1. попробуйте
selenium
2. Этот вопрос игнорирует политики instagram.