#c# #pdf-generation #ms-office #openoffice.org #doc
#c# #генерация pdf #ms-office #openoffice.org #документ
Вопрос:
Мне нужно конвертировать PDF-файлы в .файлы doc с использованием C #. На компьютере нет файловой системы, хотя на нем не установлен Office. Есть хорошие идеи, как я могу подойти к этому? Я провел некоторое исследование, и большинство людей используют службы взаимодействия.
Комментарии:
1. Что именно вы подразумеваете под «на компьютере нет файловой системы», потому что это утверждение не имеет смысла. Честно говоря, лучший подход — это office interop.
2. Возможно, не установлена операционная система Windows?
3. Ну, компьютер в значительной степени просто работает… Кроме того, мне нужно конвертировать PDF в PNG и DOC в PNG… Я понятия не имею, как это сделать без interop
4. почему бы вам не купить инструмент для этого. Если вы не готовы к этому и хотите написать это самостоятельно, тогда вопрос слишком широкий.
Ответ №1:
Вы должны понимать, что PDF на самом деле не реализован как единый формат документа.
Если ваши PDF-документы создаются путем перевода текста в PDF-файл, то прямое преобразование PDF не только возможно, но и может быть очень хорошим (надежным).
Если источником вашего PDF-файла является сканер или факс (по сути, сканер …), то у вас есть документ с «изображением» текста. С этим сценарием справиться сложнее. Если вы откроете разметку для этого, там не будет «текста» для преобразования. В этой ситуации вам приходится иметь дело с каким-либо способом OCR (оптического распознавания символов), который менее надежен из-за множества проблем.
Если у вас есть возможность перехватывать данные до того, как они будут переведены в PDF (скажем, как в SSRS или Crystal), то для вас было бы лучше обойти этап PDF и переместить свои данные в документ Word.
Если вы ограничены приемом факсов, а затем вам нужно интерпретировать их содержимое, приготовьтесь к аду распознавания текста. Прошло некоторое время с тех пор, как я был там, поэтому я надеюсь, что это стало лучше.
Даже если на вашем компьютере не установлен office, у вас есть доступ (с Visual Studios) к Office developer toolkit, который позволит вам создавать документы для распространения в форматах Word.(.doc/.docx ).
Ответ №2:
Вариантом / идеей может быть преобразование PDF в Html, который можно открыть в Word?
Ответ №3:
используйте aspose pdf kit для преобразования pdf в текст, а затем текста в документ с помощью filestream или aspose doc