Лучший формат разметки для будущей проверки больших фрагментов текста?

#storage #markdown #markup #multimarkdown

#Хранение #markdown #разметка #multimarkdown

Вопрос:

У меня есть несколько записей (=< 100), которые содержат большие фрагменты текста, которые требуют разметки (семантически: списки, заголовки, таблицы, ссылки, цитаты и т. Д.) Перед сохранением в формате файла для повторного использования.

При хранении он, вероятно, останется более или менее неизменным в течение максимально возможного количества лет в будущем.

Он содержит некоторые не-ascii, поэтому требуется UTF-8. Я начал использовать HTML, затем рассмотрел Markdown… но хотелось бы знать, какой, по мнению людей, наиболее перспективный формат разметки для долгосрочного хранения? Содержимое изначально предназначено для (в основном статического) веб-сайта, но может использоваться в качестве содержимого для других выходных данных.

Наконец, мнения о выборе хранилища для долгосрочного использования — база данных, отдельные документы …? Изменения в записях будут происходить нечасто и редактироваться всего 1-3 людьми, а доступ для чтения со временем должен увеличиться.


Обновить:

Я, наконец, выбрал общие функции (например, для таблиц) между MultiMarkdown, PHP Markdown Extra и Kramdown в качестве текстового формата (Markdown пропускает слишком много тегов HTML) и конвертирую полученные файлы в html с помощью Kramdown. Сейчас я пробую редакторы Markdown для iOS, которые могут обрабатывать расширенную разметку и синхронизировать через Dropbox с моим рабочим столом / ноутбуком.

Комментарии:

1. 8 просмотров, нет ответов / мнений? Да ладно! Дай мне знать, что ты думаешь.

Ответ №1:

Любое хранилище, не предназначенное для долговременного архивирования, сломается.

Вопрос не столько в соотношении базы данных и файловой системы, сколько в том, как гарантировать, что не произойдет (беззвучного) повреждения данных, и как перенести данные. Я не могу дать вам однозначных ответов, потому что это зависит от множества факторов (включая затраты), но вот несколько ресурсов:

У меня нет реального ответа на вопрос о формате, но я думаю, что HTML UTF-8 должен быть читаемым даже через десятилетия, но документируйте это.

Комментарии:

1. Это именно тот ответ, которого я ждал — спасибо.