Получение значений (имя, адрес, телефон и т.д.) с веб-сайтов каталогов, таких как TruePeopleSearch.com с помощью инструмента разработчика Chrome

#python #json #parsing #uri

#python #json #синтаксический анализ #uri

Вопрос:

Всем доброго дня. Я все еще изучаю синтаксический анализ данных с помощью Python. Сейчас я пытаюсь ознакомиться с инструментами разработчика Chrome. Мой вопрос заключается в том, что при проверке веб-сайта каталога, например TruePeopleSearch.com , как мне скопировать или просмотреть переменные, содержащие такие данные, как имя, телефон и адрес? Я попытался просмотреть инструмент, но, поскольку я новичок в инструменте разработчика, я так запутался со всеми данными. Я был бы признателен, если бы здешние эксперты указали мне правильное направление.

Спасибо вам всем!

Комментарии:

1. если вы имеете в виду информацию в HTML, то переменных нет — она сохраняет все в виде дерева с HTML, и вы можете использовать xpath css селекторы or, чтобы получить ее в модулях Python, таких как lxml or BeautifulSoup . А в DevTools у вас должны быть опции (в контекстном меню) get xpath for selected element

2. Да, я подумал, что мне проще просто проанализировать данные из тела HTML с помощью BeautifulSoup, чем брать из путей JS. Спасибо, Фурас, я сейчас изучаю soup.

Ответ №1:

После дальнейшей навигации по консоли разработчика я узнал, что эти строки находятся в этих переменных, скопировав пути JS.

ИМЯ И ВОЗРАСТ

документ.querySelector(«#PersonDetails > div: n-й дочерний элемент (1)»).Внутренний текст

АДРЕС

документ.querySelector(«#PersonDetails > div: n-й дочерний элемент (4)»).Внутренний текст

НОМЕРА ТЕЛЕФОНОВ

документ.querySelector(«#PersonDetails > div: n-й дочерний элемент (6)»).Внутренний текст

ШАГ 1

На веб-сайте выделите то, что вам нужно проверить, и нажмите «Проверить элемент».

ШАГ 2

В разделе элементы щелкните правой кнопкой мыши выделенную часть и скопируйте путь JS

ШАГ 3

Перейдите в консоль и вставьте путь JS и add .innerText и нажмите Enter