#javascript #dom #web-scraping #dynamic-html
#javascript #dom #очистка веб-страниц #dynamic-html
Вопрос:
если в моем браузере javascript генерируется целая куча элементов (с использованием данных JSON или просто из воздуха) Я не могу полностью заархивировать такую страницу, сохранив ее исходный код. Я уже пытался сохранить его как .mht-файл в IE, но это не работает — IE также не сохраняет динамически сгенерированные элементы.
Пример такой страницы здесьhttp://www.amazon.com/gp/bestsellers/wireless/ref=zg_bs_nav — обратите внимание, что элементы «price» и «X new» не существуют в исходном html, а скорее генерируются динамически.
Если бы я хотел разобрать это, я мог бы работать непосредственно с DOM различными способами, блядь-блядь. Но если я хочу автоматически сохранить страницу как html-документ, чтобы ее можно было визуализировать со всеми динамически генерируемыми элементами, которые хорошо визуализируются даже при выключенном javascript, пока я SOL.
Есть предложения?
Комментарии:
1. вы изучали FireBug, плагин для браузера ( getfirebug.com )?
2. @Dutchie432, я не думаю, что FireBug способен на это. Вы можете доказать, что я ошибаюсь, вставив html (включая цену и т.д.) Из такого созданного FireBug архива вышеупомянутой страницы здесь в качестве ответа.
Ответ №1:
В Firefox есть расширение Web Developer:https://addons.mozilla.org/en-US/firefox/addon/web-developer
После установки вы можете использовать Просмотр исходного кода -> Просмотр сгенерированного исходного кода для доступа к измененному JavaScript HTML.