#web-scraping #beautifulsoup #hyperlink #jobs
#питон #соскабливание паутины #прекрасный суп #гиперссылка
Вопрос:
Извините, если об этом спрашивали раньше, но я пытаюсь вытащить некоторые задания из indeed и получить URL-адрес страницы из заголовка, просто чтобы я мог также получить описание с новой страницы. Раньше это работало нормально, но недавно у меня появился этот код ошибки:
ссылка = вакансии.найти(«a», class_=»jobtitle»)[«href»] Ошибка типа: объект «Нетип» не может быть подписан
В любом случае, вот код.
results = soup.findAll("div", {"class": "result"}) for jobs in soup.find_all(class_="result"): **link = jobs.find("a", class_="jobtitle")["href"] if "http" not in link: link = "http://uk.indeed.com" link print("Link:", link)** page = requests.get(link) soup = BeautifulSoup(page.content, "html.parser") try: job_description = soup.find( "div", id="jobDescriptionText" ).decode_contents(formatter="html") except Exception as e: job_description = None print("job_description:", job_description)
Пожалуйста, помогите
Ответ №1:
При этом вам, возможно, потребуется использовать get
для извлечения href из тега:
link = jobs.find("a", class_="jobtitle").get("href")