извлечение скрытой электронной почты с веб-страницы

#python #selenium-webdriver #web-scraping

#python #selenium-webdriver #очистка веб-страниц

Вопрос:

Я хочу извлечь электронное письмо с этой веб-страницы:https://aiwa.ae/company/arad-building-material-trading Я пробовал requests и Beautifulsoup, но они не сработали. Я создал этот код, используя selenium, но не сработал так хорошо:

 from selenium import webdriver

u = "https://aiwa.ae/company/arad-building-material-trading"
driver = webdriver.Chrome(executable_path=r"C:chromedriver.exe")
driver.get(u)

driver.find_element_by_xpath('/html/body/div[1]/div[1]/div[3]/div/div[1]/div/div[2]/ul[1]/li[5]/a').get_attribute('href')

  

Комментарии:

1. вы получаете ошибку или что? Возможно, вам следует использовать class or id в xpath вместо всего этого div

2. как насчет xpath('//li[@itemprop="email"]/a') ?

Ответ №1:

Используйте приведенный ниже код для печати электронной почты:

 from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait

driver = webdriver.Chrome('..driverschromedriver')
driver.get("https://aiwa.ae/company/arad-building-material-trading")
driver.maximize_window()
email = WebDriverWait(driver, 10).until(EC.visibility_of_element_located((By.XPATH, "//li[@itemprop='email']/a"))).text
print(email)