Действительно, индивидуальные ссылки на вакансии

#web-scraping #beautifulsoup #hyperlink #jobs

#питон #соскабливание паутины #прекрасный суп #гиперссылка

Вопрос:

Извините, если об этом спрашивали раньше, но я пытаюсь вытащить некоторые задания из indeed и получить URL-адрес страницы из заголовка, просто чтобы я мог также получить описание с новой страницы. Раньше это работало нормально, но недавно у меня появился этот код ошибки:

ссылка = вакансии.найти(«a», class_=»jobtitle»)[«href»] Ошибка типа: объект «Нетип» не может быть подписан

В любом случае, вот код.

   results = soup.findAll("div", {"class": "result"})   for jobs in soup.find_all(class_="result"):   **link = jobs.find("a", class_="jobtitle")["href"]  if "http" not in link:  link = "http://uk.indeed.com"   link  print("Link:", link)**   page = requests.get(link)  soup = BeautifulSoup(page.content, "html.parser")  try:  job_description = soup.find(  "div", id="jobDescriptionText"  ).decode_contents(formatter="html")  except Exception as e:  job_description = None  print("job_description:", job_description)  

Пожалуйста, помогите

Ответ №1:

При этом вам, возможно, потребуется использовать get для извлечения href из тега:

 link = jobs.find("a", class_="jobtitle").get("href")