#java #javascript #parsing
#java #javascript #синтаксический анализ
Вопрос:
Я пытаюсь написать программу, которая обращается к веб-страницам с помощью Apache HttpClient API и извлекает веб-страницу. Теперь я хочу извлечь javascripts из выбранных страниц.. Мне интересно, есть ли какой-нибудь Api или что-то еще? Не уверен, что DOMParser это делает? Любое предложение
Спасибо вам за помощь и руководство.
С уважением
Ответ №1:
Ознакомьтесь с синтаксическим анализатором Jericho HTML, особенно с примером поиска определенных тегов.