существует ли инструмент для захвата всех элементов веб-страницы DOM, сгенерированных javascript на стороне браузера, в виде html для создания полностраничного html-архива?

#javascript #dom #web-scraping #dynamic-html

#javascript #dom #очистка веб-страниц #dynamic-html

Вопрос:

если в моем браузере javascript генерируется целая куча элементов (с использованием данных JSON или просто из воздуха) Я не могу полностью заархивировать такую страницу, сохранив ее исходный код. Я уже пытался сохранить его как .mht-файл в IE, но это не работает — IE также не сохраняет динамически сгенерированные элементы.

Пример такой страницы здесьhttp://www.amazon.com/gp/bestsellers/wireless/ref=zg_bs_nav — обратите внимание, что элементы «price» и «X new» не существуют в исходном html, а скорее генерируются динамически.

Если бы я хотел разобрать это, я мог бы работать непосредственно с DOM различными способами, блядь-блядь. Но если я хочу автоматически сохранить страницу как html-документ, чтобы ее можно было визуализировать со всеми динамически генерируемыми элементами, которые хорошо визуализируются даже при выключенном javascript, пока я SOL.

Есть предложения?

Комментарии:

1. вы изучали FireBug, плагин для браузера ( getfirebug.com )?

2. @Dutchie432, я не думаю, что FireBug способен на это. Вы можете доказать, что я ошибаюсь, вставив html (включая цену и т.д.) Из такого созданного FireBug архива вышеупомянутой страницы здесь в качестве ответа.

Ответ №1:

В Firefox есть расширение Web Developer:https://addons.mozilla.org/en-US/firefox/addon/web-developer

После установки вы можете использовать Просмотр исходного кода -> Просмотр сгенерированного исходного кода для доступа к измененному JavaScript HTML.