#python #selenium #web-scraping
#python #селен #веб-очистка
Вопрос:
Я относительно новичок в программировании, хочу получить информацию с веб-страницы, которая написана внутри span, но не уверен, как это сделать. Вот пример кода, данные, которые я хочу извлечь, — это «Октябрь 2001 — январь 2002»
<h4 class="pv-entity__date-range t-14 t-black--light t-normal">
<span class="visually-hidden">Dates Employed</span>
<span>Oct 2001 – Jan 2002</span>
</h4>
Любая помощь приветствуется! Спасибо.
Ответ №1:
Чтобы получить тег span этого элемента.
elem=driver.find_element_by_css_selector("h4.pv-entity__date-range.t-14.t-black--light.t-normal>span:nth-child(2)")
print(elem.text)
Ответ №2:
Логика …
elem = driver.find_elements_by_xpath('.//span[@class = "pv-entity__date-range.t-14.t-black--light.t-normal"][1]')
или
elem = driver.find_elements_by_xpath("//[contains(@class,'pv-entity__date-range t-14 t-black--light t-normal')][1]")
Комментарии:
1. Спасибо. Я попытался использовать этот xpath для извлечения данных, используя этот код: prev = sel.xpath(‘.//span[@class = «pv-entity__date-range.t-14.t-black—light.t-normal»][1]’).extract_first() — выполняется, но когда я выполняю print(prev), он возвращает «None» . У вас есть какие-либо советы?
2. вы пробовали elem.text и измените номер фрагмента в конце на [2] . НО вы не можете использовать метод extract_first() и индекс среза [1], [2] …