#pdf #ghostscript
Вопрос:
У меня есть этот повернутый PDF-файл, и мне нужно преобразовать его в текстовый файл с помощью приложения Ghostscript.
Как я могу это сделать? Я использую основные параметры, и он читает текст «обычным» способом (сверху слева вниз справа). Мне нужно, чтобы он читался снизу слева вверх справа.
-sDEVICE=txtwrite -o"C:GS_temp_file.txt" "C:test.pdf
Комментарии:
1. Устройство txtwrite в своей настройке по умолчанию пытается вывести простой текстовый файл, соответствующий компоновке исходного файла. Так что да, я ожидал бы, что он создаст текстовый файл с текстовой ориентацией, как у вас. Если вы этого не хотите, то используйте один из других форматов вывода и самостоятельно считайте координаты. Или сначала поверните страницу (установите размер носителя в ландшафтный, используя точки ширины и высоты УСТРОЙСТВА, а затем установите значение FIXEDMEDIA), а затем используйте-dFitPage. Алгоритм подгонки страницы поймет, что содержимое подходит лучше повернутого, и повернет страницу. Это должно привести к тексту, ориентированному горизонтально.
2. Не уверен, что я понимаю, так ты предлагаешь что-то подобное?
-DEVICEWIDTHPOINTS=1600 -DEVICEHEIGHTPOINTS=900 -dFIXEDMEDIA -dFitPage -sDEVICE=txtwrite -o"C:GS_temp_file.txt" "C:Temppdf.pdf"
3. Да, именно это я и имел в виду
4. К сожалению, я не заметил здесь никаких изменений. Текст читается так, как он читался раньше — по умолчанию слева направо. Также стоит отметить, что pdf может содержать несколько страниц.
5. И txtwrite может создавать несколько страниц вывода, используя %d в имени файла. Без примера файла, на который можно посмотреть, я боюсь, что больше ничем не смогу помочь.