#python #selenium #web-scraping #beautifulsoup #automation
#python #selenium #очистка веб-страниц #beautifulsoup #автоматизация
Вопрос:
Здесь я хочу получить все идентификаторы, отмеченные красным квадратом на данном рисунке, в списке, использующем python. Эти идентификаторы также являются случайными и динамическими!
Комментарии:
1. можете ли вы показать, что вы пробовали
2. что вы имеете в виду, говоря «продолжать меняться»?
3. Добавьте образец этого HTML или страницы, с которой вы это извлекаете
Ответ №1:
Вы можете серачить ul
тег и выполнить цикл поиска, а затем получить атрибут элемента.
elements=driver.find_elements_by_css_selector("ul.plan-card-blue")
id_list=[]
for ele in elements:
id_list.append(ele.get_attribute("id"))
Ответ №2:
извлеките все элементы ul из браузера
links = browser.find_elements_by_tag_name("ul")
зациклите список и получите значение идентификатора
for element in links
idValue = element.get_attribute("id")
хотите сохранить его в массиве, используйте это
idValue=[]
for element in links:
idValue.append(element.get_attribute("id"))
Комментарии:
1. это тоже работает, но также содержит некоторые ненужные элементы в списке. чтобы их исключить, код должен быть: для элемента в ссылках: #поскольку идентификаторы имеют длину пять, поэтому он получает только их. если len(элемент.get_attribute(«id»))==5: idValue.append(элемент.get_attribute(«id»))