Определение того, какие внешние ресурсы JavaScript загружает на страницу с помощью инструмента Java

#java #javascript #dom

#java #javascript #dom

Вопрос:

Я ищу способ определить, какие внешние ресурсы (если таковые имеются) JavaScript на данной странице загружает с других URL, чтобы я мог создать своего рода «график зависимостей». Я могу получить ресурсы, загружаемые HTML и CSS, путем их синтаксического анализа, но я не уверен в JavaScript.

Возможно ли это? Можно ли это сделать на Java? (Не JavaScript, а автономный инструмент Java.)

Комментарии:

1. Где бы вы запустили такой инструмент? Как бы JavaScript получил доступ к доменам других сайтов, вы бы загрузили их в него? У меня возникли проблемы с выяснением того, что вы на самом деле пытаетесь сделать. (Когда вы говорите «Можно ли это сделать на Java», вы действительно имели в виду Java? Не JavaScript?)

2. Я хотел бы написать код на Java (да, Java, а не Javascript), который при задании URL страницы будет записывать, какой js есть на странице и какие другие URL-адреса изменил js.

3. Получить js не проблема — я просто просматриваю исходный код в HTML. Проблема заключается в получении URL-адресов, которые меняются в каждом js.

4. @user: JavaScript на одной странице не может изменять содержимое других URL-адресов. Он может (с ограничениями) изменять загруженную страницу в другом окне, которое могло быть получено с другого URL. Но я боюсь, что объясненный вопрос просто не имеет особого смысла, я думаю, вы можете быть сбиты с толку тем, что такое JavaScript и URL-адреса.

5. @user: Я обновил вопрос, чтобы отразить обсуждение выше.

Ответ №1:

Возможно, вы могли бы написать какой-нибудь код, который отслеживает HTTP-коммуникации, и запустить свой html-документ под ним. В журнале должно быть указано, какие URL-адреса были запрошены документом.

Ответ №2:

Возможно, вы можете выполнить свой скрипт через HtmlUnit и переопределить функции внешней загрузки Rhino

Всего лишь мои 2 цента