#python-3.x #web-scraping
#python-3.x #очистка веб-страниц
Вопрос:
Во-первых, пожалуйста, поймите, что есть много ответов на вопросы о типах входа на форуме. Это другое, поскольку это приглашение не отображается в HTML или JS.
Я пытаюсь автоматизировать некоторые операции очистки веб-страниц.
Я хотел бы использовать что-то вроде следующего для входа на страницу:
login_URL = 'https://somewebsite.com'
page_URL = 'https://somewebsite.com'
payload{
'Username': 'yourusername',
'Password': 'yourpassword'
}
with requests.Session() as session:
post = session.post(login_URL, data=payload)
r = session.get(page_URL)
print(r.text)
Основываясь на моих исследованиях, это кажется невозможным, поскольку приглашение появляется еще до загрузки страницы.
Любая информация была бы полезна!
Комментарии:
1. Это настолько олдскульно, я лично не видел этого годами, и поэтому я могу только догадываться, что это, вероятно, ответ браузера на
401 Unauthorized
… но опубликованное вами изображение выглядит для меня слишком нестандартным , так что, возможно, это все-таки JS . Добавьте ссылку на реальный сайт. Без этого я сомневаюсь, что вы получите ответ. Но, как дикое предположение: попробуйтеsession.get('https://yourusername:yourpassword@somewebsite.com')
. Поможет ли это?2. session.get(‘ yourusername:yourpassword@somewebsite.com ‘ ) было ли это! Это работает отлично. Большое спасибо!
Ответ №1:
Из комментариев становится ясно, что это был ответ браузера на 401 Unauthorized
.
Итак, для входа в систему вам нужно сделать это:
session.get('https://yourusername:yourpassword@somewebsite.com')