Поиск трудностей при очистке определенного поля с помощью lxml или beautifulsoup python

#python #html #lxml #screen-scraping

#python #HTML #lxml #очистка экрана

Вопрос:

Я новичок в очистке, можете ли вы подсказать мне, как получить цену («299,00») из следующего html с использованием python lxml или beautifulsoup?

Изображение HTML-КОДА прилагается

Нажмите, чтобы увидеть изображение Html-кода

     from lxml import html
    import requests

    url="https://world.taobao.com/item/537221576985.htm?fromSite=mainamp;spm=a21ct.7779917.1441024229133.8.AvoEs0"
    page=requests.get(url)
    tree=html.fromstring(page.text)


    price=tree.xpath('//strong[@class="tb-rmb-num"]/text()')

    print(price)

1. Похоже, это .price strong должно сработать, я думаю, что обе библиотеки могут это сделать.

2. Я думаю, что нашел реальную проблему, на самом деле на странице продукта цена загружается, когда браузер открывает ее (вероятно, веб-сайт использует javascript), поэтому он не получал цену. Я думаю, что запросы получают только html, который доступен в данный момент, поэтому я использовал selenium для открытия страницы в браузере, а затем использовал приведенный выше код для получения цены.

Вопрос:

Комментарии:

Вам также может понравиться

Unity GameObject не будет перемещаться в сторону сборного

Ожидание завершения анимации, а затем продолжение в цикле

Распределение стимулов в процентах