Pandoc теряет заголовок и другие метаданные при преобразовании из docx в markdown

#markdown #docx #pandoc

#markdown #docx #pandoc

Вопрос:

Преобразуйте следующий файл markdown в docx с помощью pandoc ex.md -o ex.docx :

 ---
title: 'My beautiful title'
author: 'Joe Myself'
date: '2019-03-12'
...

Bla, bla, bla.

  

Теперь преобразуйте полученный результат ex.docx обратно в markdown с помощью pandoc ex.docx -o ex2.md . Я ожидаю, что ex2.md будет похоже на ввод ex.md , вместо этого блок метаданных исчезнет.

Я попытался указать типы from / to плюс / минус расширение yaml_metadata_block или pandoc_title_block , но ничего не изменилось. Глядя на шаблон markdown, я вижу, что он начинается с $titleblock$ , но как преобразовать три метаданных в titleblock?

Просматривая AST с помощью pandoc ex.docx -t json , я вижу, что заголовок, автор и дата действительно присутствуют в ex.docx . Чего мне не хватает? Спасибо!

Комментарии:

1. Попробуйте добавить параметр командной строки --standalone (short: -s ).

2. Идеально! Это решает мою проблему. Мне нужно только передать выходные данные в, sed чтобы избавиться []{#xxxx .anchor} от заголовка.

3. Очевидно, что в реальном варианте использования.

4. В выпуске # 1893 есть лучшее решение для удаления привязки заголовка.

5. -s у меня не сработал. у меня есть заголовки в docx, но все они удаляются в markdown. В нем должно быть # или ##