Как я могу извлечь информацию из использования selenium?

#python #selenium #web-scraping

#python #селен #веб-очистка

Вопрос:

Я относительно новичок в программировании, хочу получить информацию с веб-страницы, которая написана внутри span, но не уверен, как это сделать. Вот пример кода, данные, которые я хочу извлечь, — это «Октябрь 2001 — январь 2002»

 <h4 class="pv-entity__date-range t-14 t-black--light t-normal">
      <span class="visually-hidden">Dates Employed</span>
      <span>Oct 2001 – Jan 2002</span>
    </h4>
  

Любая помощь приветствуется! Спасибо.

Ответ №1:

Чтобы получить тег span этого элемента.

 elem=driver.find_element_by_css_selector("h4.pv-entity__date-range.t-14.t-black--light.t-normal>span:nth-child(2)")
print(elem.text)
  

Ответ №2:

Логика …

    elem = driver.find_elements_by_xpath('.//span[@class = "pv-entity__date-range.t-14.t-black--light.t-normal"][1]')
  

или

 elem = driver.find_elements_by_xpath("//[contains(@class,'pv-entity__date-range t-14 t-black--light t-normal')][1]") 
  

Комментарии:

1. Спасибо. Я попытался использовать этот xpath для извлечения данных, используя этот код: prev = sel.xpath(‘.//span[@class = «pv-entity__date-range.t-14.t-black—light.t-normal»][1]’).extract_first() — выполняется, но когда я выполняю print(prev), он возвращает «None» . У вас есть какие-либо советы?

2. вы пробовали elem.text и измените номер фрагмента в конце на [2] . НО вы не можете использовать метод extract_first() и индекс среза [1], [2] …