#python #selenium-webdriver #web-scraping
#python #selenium-webdriver #очистка веб-страниц
Вопрос:
Я хочу извлечь электронное письмо с этой веб-страницы:https://aiwa.ae/company/arad-building-material-trading Я пробовал requests и Beautifulsoup, но они не сработали. Я создал этот код, используя selenium, но не сработал так хорошо:
from selenium import webdriver
u = "https://aiwa.ae/company/arad-building-material-trading"
driver = webdriver.Chrome(executable_path=r"C:chromedriver.exe")
driver.get(u)
driver.find_element_by_xpath('/html/body/div[1]/div[1]/div[3]/div/div[1]/div/div[2]/ul[1]/li[5]/a').get_attribute('href')
Комментарии:
1. вы получаете ошибку или что? Возможно, вам следует использовать
class
orid
вxpath
вместо всего этогоdiv
2. как насчет
xpath('//li[@itemprop="email"]/a')
?
Ответ №1:
Используйте приведенный ниже код для печати электронной почты:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
driver = webdriver.Chrome('..driverschromedriver')
driver.get("https://aiwa.ae/company/arad-building-material-trading")
driver.maximize_window()
email = WebDriverWait(driver, 10).until(EC.visibility_of_element_located((By.XPATH, "//li[@itemprop='email']/a"))).text
print(email)