как мы можем распечатать точный формат данных из PDF или файла изображения в excel или word с помощью selenium java

#java

Вопрос:

Мне нужна помощь от вас, ребята, я пытался извлечь данные из PDF в excel, но я получаю данные только в одной ячейке. пожалуйста, найдите мой код ниже и дайте мне знать решение.

 public void readPDFfromintranet() throws Exception {
    FileInputStream fis = new FileInputStream(filein);
    PDDocument pdfdocument = PDDocument.load(fis);
    int count = pdfdocument.getNumberOfPages();
    System.out.println(count);
    PDFTextStripper textstriper = new PDFTextStripper();
    String doctext = textstriper.getText(pdfdocument);
    System.out.println(doctext);
    
    HSSFWorkbook workbook = new HSSFWorkbook();
    HSSFSheet sheet = workbook.createSheet();
    sheet.createRow(0);
    sheet.getRow(0).createCell(1).setCellValue(doctext);
    FileOutputStream fileout = new FileOutputStream("D:\Raghavendra\Isolve\Output.xls");
    workbook.write(fileout);
    workbook.close();
    
    pdfdocument.close();
    fis.close();
}
 

Комментарии:

1. Это не имеет никакого отношения к селену.

2. Учитывая информацию, представленную в вашем вопросе, ваш код делает именно то, что вы описываете. Он извлекает текст из PDF-документа, записывает его в одну ячейку на листе Excel и записывает в файл. Если вам нужно более детальное чтение вашего PDF-документа, вам, возможно, следует предоставить хотя бы снимок экрана PDF-документа и более точно описать, что вы собираетесь делать.