Как я могу сохранить «полный» HTML-файл в виде одного файла?

#html #browser #wget #utilities

#HTML #браузер #wget #Служебные программы

Вопрос:

Существуют ли какие-либо утилиты или веб-браузеры, которые могут сохранять файл и ресурсы, на которые даны ссылки, в виде одного HTML-файла?

В большинстве веб-браузеров / wget есть возможность загружать необходимые CSS и изображения в виде отдельных файлов. Есть ли способ автоматически встроить CSS и изображения?

Комментарии:

1. 1 кажется интересным вопросом, непрактичным для большинства сайтов, но может быть полезным для некоторых.

2. Встроенные изображения? Как это должно работать, base64’d в разделах CDATA? Удачи, убедив браузер прочитать это.

3. Мне кажется, это должно быть выполнимо теоретически. Файлы CSS и JS, безусловно, могут быть проанализированы и встроены в заголовок с некоторой проверкой пути. Изображения, возможно, могут быть закодированы в данные и закодированы в <img /> теги. Не уверен, что знаю хоть одну утилиту, которая это сделает. Хороший вопрос, хотя.

Ответ №1:

Я создал для этого скрипт на python. До сих пор это идеально удовлетворяло мои собственные потребности. Надеется быть полезным.

https://github.com/zTrix/webpage2html

Комментарии:

1. Именно то, что я искал. Спасибо! <3

Ответ №2:

Для этого используется формат MHTML.

http://en.wikipedia.org/wiki/MHTML

Комментарии:

1. 1 IE поддерживает это (с расширением .mht) с тех пор, как всегда… ну, начиная с версии 5.0.

2. Обратите внимание, что Safari не поддерживает

Ответ №3:

Это веб-расширение может вам помочь.

https://github.com/gildas-lormeau/SingleFile

«Это помогает вам сохранить полную веб-страницу в один HTML-файл».

Он доступен практически для всех популярных браузеров.

Ответ №4:

Safari (как на Windows, так и на Mac) может создавать .веб-архивирование файлов.

Ссылка:
http://en.wikipedia.org/wiki/Webarchive

Ответ №5:

Если у вас есть доступ к wget , то у вас, вероятно, есть доступ и к tar утилите. Хотя это не даст вам читаемый в браузере отдельный файл, если вы wget создадите страницу, а затем tar все загруженные артефакты, у вас фактически будет версия всего необходимого для этой страницы в 1 файл.