Выделите слова в PDF с помощью PDFBox 1.8.9 и VB Net

#vb.net #pdfbox #highlight

#vb.net #pdfbox #выделите

Вопрос:

Я пытаюсь выделить слова в PDF с помощью PDFBox 1.8.9 и VB Net.

У меня есть список слов, которые мне нужно выделить в pdf. Я не знаю их расположения, у меня просто есть список.

Я пытаюсь использовать PDFBox в качестве библиотеки, которая поможет мне, но каждая ссылка, которую я нашел, указывает на Java, с которой у меня нет опыта.

Я использую PDFBox для разбора текста и аннотаций, но на самом деле испытываю трудности с выделением.

Я знаю, что это, вероятно, кажется старой темой, которая была рассмотрена ранее. Но, как я уже сказал, каждая найденная мной ссылка указывает на Java. Я пытался более 3 недель заставить это работать, но безуспешно!

Я пробовал iTextSharp, Acrobat.tlb с переменным успехом, но действительно хочется, чтобы это работало с PDFBox.

Спасибо.

Комментарии:

1. Не могли бы вы поделиться некоторым имеющимся у вас кодом для PDFBox

2. Единственный код, который у меня есть, предназначен для синтаксического анализа текста и аннотаций, мне буквально нечего выделить, и я тоже ничего не могу найти.

3. Существует инструмент, который приближается к этому (DrawPrintTextLocations.java ) но это для версии 2.0. *. PDFBox 1.8 не очень хорош со шрифтами. И вам не следует использовать IKVM (вы упомянули VB Net), это больше не поддерживается. в версии 1.8 есть PrintTextLocations. пример Java, но это просто указывает местоположения и ничего не рисует (что довольно сложно из-за множества разных типов шрифтов).

4. Спасибо, Тилман, вы не знаете, доступна ли .net-версия PDFBox 2.0?

5. Я не знаю. Команда не поддерживала даже версию 1.8 .net. Если вы настаиваете на использовании PDFBox, вам следует изучить java.