Измените все ссылки внутри html-файла, чтобы добавить URL-адрес домена

#javascript #ruby #web-scraping #wget

#javascript #ruby #веб-очистка #wget

Вопрос:

Я использую wget для очистки сайта и преобразования всех ссылок для использования загруженных ресурсов.

Я хотел бы знать, есть ли какой-либо способ просмотреть все ссылки на странице, включая таблицы стилей, скрипты, ссылки внутри встроенного CSS, и добавить к ним домен.

все мои ссылки прямо сейчас похожи /something.css , и я хочу изменить их на https://awebsite.com/something.csss , wget, похоже, не поддерживает это

ps: Мне нужно изменить ссылки, чтобы я мог обслуживать статический сайт через прокси-URL

Комментарии:

1. Проанализируйте файл и gsub каждого узла привязки. Или удалите все окончания строк и добавьте предпочитаемую строку.

Ответ №1:

Я просто закончил тем, что использовал базовый HTML-тег для изменения базовых

   <base href="https://www.w3schools.com/" target="_blank">
  

но это может быть не лучшим решением для всех, в моем случае это сработало