#storage #markdown #markup #multimarkdown
#Хранение #markdown #разметка #multimarkdown
Вопрос:
У меня есть несколько записей (=< 100), которые содержат большие фрагменты текста, которые требуют разметки (семантически: списки, заголовки, таблицы, ссылки, цитаты и т. Д.) Перед сохранением в формате файла для повторного использования.
При хранении он, вероятно, останется более или менее неизменным в течение максимально возможного количества лет в будущем.
Он содержит некоторые не-ascii, поэтому требуется UTF-8. Я начал использовать HTML, затем рассмотрел Markdown… но хотелось бы знать, какой, по мнению людей, наиболее перспективный формат разметки для долгосрочного хранения? Содержимое изначально предназначено для (в основном статического) веб-сайта, но может использоваться в качестве содержимого для других выходных данных.
Наконец, мнения о выборе хранилища для долгосрочного использования — база данных, отдельные документы …? Изменения в записях будут происходить нечасто и редактироваться всего 1-3 людьми, а доступ для чтения со временем должен увеличиться.
Обновить:
Я, наконец, выбрал общие функции (например, для таблиц) между MultiMarkdown, PHP Markdown Extra и Kramdown в качестве текстового формата (Markdown пропускает слишком много тегов HTML) и конвертирую полученные файлы в html с помощью Kramdown. Сейчас я пробую редакторы Markdown для iOS, которые могут обрабатывать расширенную разметку и синхронизировать через Dropbox с моим рабочим столом / ноутбуком.
Комментарии:
1. 8 просмотров, нет ответов / мнений? Да ладно! Дай мне знать, что ты думаешь.
Ответ №1:
Любое хранилище, не предназначенное для долговременного архивирования, сломается.
Вопрос не столько в соотношении базы данных и файловой системы, сколько в том, как гарантировать, что не произойдет (беззвучного) повреждения данных, и как перенести данные. Я не могу дать вам однозначных ответов, потому что это зависит от множества факторов (включая затраты), но вот несколько ресурсов:
- Создание лучшей системы долгосрочного архивного хранения, доклад Миллера / Сторера в Библиотеке Конгресса
- Цифровая дилемма, книга, предназначенная для архивирования фильмов, но освещает некоторые проблемы долгосрочного архивирования.
- Project Honeycomb, проект SUN для долгосрочного архивирования с открытым исходным кодом, но прекращенный.
У меня нет реального ответа на вопрос о формате, но я думаю, что HTML UTF-8 должен быть читаемым даже через десятилетия, но документируйте это.
Комментарии:
1. Это именно тот ответ, которого я ждал — спасибо.