Как я могу конвертировать PDF в doc без microsoft.office.interop?

#c# #pdf-generation #ms-office #openoffice.org #doc

#c# #генерация pdf #ms-office #openoffice.org #документ

Вопрос:

Мне нужно конвертировать PDF-файлы в .файлы doc с использованием C #. На компьютере нет файловой системы, хотя на нем не установлен Office. Есть хорошие идеи, как я могу подойти к этому? Я провел некоторое исследование, и большинство людей используют службы взаимодействия.

Комментарии:

1. Что именно вы подразумеваете под «на компьютере нет файловой системы», потому что это утверждение не имеет смысла. Честно говоря, лучший подход — это office interop.

2. Возможно, не установлена операционная система Windows?

3. Ну, компьютер в значительной степени просто работает… Кроме того, мне нужно конвертировать PDF в PNG и DOC в PNG… Я понятия не имею, как это сделать без interop

4. почему бы вам не купить инструмент для этого. Если вы не готовы к этому и хотите написать это самостоятельно, тогда вопрос слишком широкий.

Ответ №1:

Вы должны понимать, что PDF на самом деле не реализован как единый формат документа.

Если ваши PDF-документы создаются путем перевода текста в PDF-файл, то прямое преобразование PDF не только возможно, но и может быть очень хорошим (надежным).

Если источником вашего PDF-файла является сканер или факс (по сути, сканер …), то у вас есть документ с «изображением» текста. С этим сценарием справиться сложнее. Если вы откроете разметку для этого, там не будет «текста» для преобразования. В этой ситуации вам приходится иметь дело с каким-либо способом OCR (оптического распознавания символов), который менее надежен из-за множества проблем.

Если у вас есть возможность перехватывать данные до того, как они будут переведены в PDF (скажем, как в SSRS или Crystal), то для вас было бы лучше обойти этап PDF и переместить свои данные в документ Word.

Если вы ограничены приемом факсов, а затем вам нужно интерпретировать их содержимое, приготовьтесь к аду распознавания текста. Прошло некоторое время с тех пор, как я был там, поэтому я надеюсь, что это стало лучше.

Даже если на вашем компьютере не установлен office, у вас есть доступ (с Visual Studios) к Office developer toolkit, который позволит вам создавать документы для распространения в форматах Word.(.doc/.docx ).

Ответ №2:

Вариантом / идеей может быть преобразование PDF в Html, который можно открыть в Word?

Ответ №3:

используйте aspose pdf kit для преобразования pdf в текст, а затем текста в документ с помощью filestream или aspose doc