#javascript #ruby #web-scraping #wget
#javascript #ruby #веб-очистка #wget
Вопрос:
Я использую wget для очистки сайта и преобразования всех ссылок для использования загруженных ресурсов.
Я хотел бы знать, есть ли какой-либо способ просмотреть все ссылки на странице, включая таблицы стилей, скрипты, ссылки внутри встроенного CSS, и добавить к ним домен.
все мои ссылки прямо сейчас похожи /something.css
, и я хочу изменить их на https://awebsite.com/something.csss
, wget, похоже, не поддерживает это
ps: Мне нужно изменить ссылки, чтобы я мог обслуживать статический сайт через прокси-URL
Комментарии:
1. Проанализируйте файл и gsub каждого узла привязки. Или удалите все окончания строк и добавьте предпочитаемую строку.
Ответ №1:
Я просто закончил тем, что использовал базовый HTML-тег для изменения базовых
<base href="https://www.w3schools.com/" target="_blank">
но это может быть не лучшим решением для всех, в моем случае это сработало