Чтение и запись файла Excel в MarkLogic

#apache-poi #marklogic #marklogic-10

#apache-poi #marklogic #marklogic-10

Вопрос:

У нас есть требование для записи и чтения файла Excel в MarkLogic и из MarkLogic, но мы получаем исключение при чтении файла Excel из MarkLogic,

Мы хотим передать полученный файл в XSSFWorkbook.java предоставляется apache.poi.

Я попробовал приведенный ниже код для записи файла Excel в MarkLogic,

     DatabaseClient client = databaseClientService.getContentClient();
    String contains = new String(Files.readAllBytes(Paths.get("src/test/resources/TestExcelEntity.xlsx")));
    BytesHandle bytesHandle = new BytesHandle();
    bytesHandle.setMimetype("application/vnd.openxmlformats-officedocument.spreadsheetml.sheet");
    bytesHandle.setFormat(Format.BINARY);
    bytesHandle.set(contains.getBytes());

    BinaryDocumentManager manager = client.newBinaryDocumentManager();
    manager.writeAs("/test/binaryDoc.xlsx", bytesHandle);
 

Код для чтения двоичного файла Excel

     FileHandle fileHandle = new FileHandle();
    fileHandle.setMimetype("application/vnd.openxmlformats-officedocument.spreadsheetml.sheet");
    fileHandle.setFormat(Format.BINARY);

    File file = manager.read("/test/binaryDoc.xlsx", fileHandle).get();

    XSSFWorkbook workbook = new XSSFWorkbook(file)
 

Я вижу загруженный файл во временном расположении, но когда я открываю загруженный файл Excel, я вижу сообщение об ошибке «Файл поврежден и не может быть открыт«, то же сообщение об ошибке, которое я вижу, когда загружаю его из qconsole.

Поскольку «/test/binaryDoc.xlsx » файл не загружается / не читается должным образом, поэтому XSSFWorkbook.java терпит неудачу с исключением.

 org.apache.poi.openxml4j.exceptions.InvalidOperationException: Can't open the specified file input stream from file: 'C:UsersSHIVLI~1AppDataLocalTemptmp9485717536946276215.vnd.openxmlformats-officedocument.spreadsheetml.sheet'

    at org.apache.poi.openxml4j.opc.ZipPackage.openZipEntrySourceStream(ZipPackage.java:162)
    at org.apache.poi.openxml4j.opc.ZipPackage.<init>(ZipPackage.java:149)
    at org.apache.poi.openxml4j.opc.OPCPackage.open(OPCPackage.java:277)
    at org.apache.poi.openxml4j.opc.OPCPackage.open(OPCPackage.java:186)
    at org.apache.poi.xssf.usermodel.XSSFWorkbook.<init>(XSSFWorkbook.java:325)
    at com.ucbos.appdata.MLSample.test(MLSample.java:55)
    at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at java.base/jdk.internal.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
    at java.base/jdk.internal.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.base/java.lang.reflect.Method.invoke(Method.java:566)
    at org.junit.runners.model.FrameworkMethod$1.runReflectiveCall(FrameworkMethod.java:50)
    at org.junit.internal.runners.model.ReflectiveCallable.run(ReflectiveCallable.java:12)
    at org.junit.runners.model.FrameworkMethod.invokeExplosively(FrameworkMethod.java:47)
    at org.junit.internal.runners.statements.InvokeMethod.evaluate(InvokeMethod.java:17)
    at org.springframework.test.context.junit4.statements.RunBeforeTestExecutionCallbacks.evaluate(RunBeforeTestExecutionCallbacks.java:74)
    at org.springframework.test.context.junit4.statements.RunAfterTestExecutionCallbacks.evaluate(RunAfterTestExecutionCallbacks.java:84)
    at org.springframework.test.context.junit4.statements.RunBeforeTestMethodCallbacks.evaluate(RunBeforeTestMethodCallbacks.java:75)
    at org.springframework.test.context.junit4.statements.RunAfterTestMethodCallbacks.evaluate(RunAfterTestMethodCallbacks.java:86)
    at org.springframework.test.context.junit4.statements.SpringRepeat.evaluate(SpringRepeat.java:84)
    at org.junit.runners.ParentRunner.runLeaf(ParentRunner.java:325)
    at org.springframework.test.context.junit4.SpringJUnit4ClassRunner.runChild(SpringJUnit4ClassRunner.java:251)
    at org.springframework.test.context.junit4.SpringJUnit4ClassRunner.runChild(SpringJUnit4ClassRunner.java:97)
    at org.junit.runners.ParentRunner$3.run(ParentRunner.java:290)
    at org.junit.runners.ParentRunner$1.schedule(ParentRunner.java:71)
    at org.junit.runners.ParentRunner.runChildren(ParentRunner.java:288)
    at org.junit.runners.ParentRunner.access$000(ParentRunner.java:58)
    at org.junit.runners.ParentRunner$2.evaluate(ParentRunner.java:268)
    at org.springframework.test.context.junit4.statements.RunBeforeTestClassCallbacks.evaluate(RunBeforeTestClassCallbacks.java:61)
    at org.springframework.test.context.junit4.statements.RunAfterTestClassCallbacks.evaluate(RunAfterTestClassCallbacks.java:70)
    at org.junit.runners.ParentRunner.run(ParentRunner.java:363)
    at org.springframework.test.context.junit4.SpringJUnit4ClassRunner.run(SpringJUnit4ClassRunner.java:190)
    at org.junit.runner.JUnitCore.run(JUnitCore.java:137)
    at com.intellij.junit4.JUnit4IdeaTestRunner.startRunnerWithArgs(JUnit4IdeaTestRunner.java:69)
    at com.intellij.rt.junit.IdeaTestRunner$Repeater.startRunnerWithArgs(IdeaTestRunner.java:33)
    at com.intellij.rt.junit.JUnitStarter.prepareStreamsAndStart(JUnitStarter.java:220)
    at com.intellij.rt.junit.JUnitStarter.main(JUnitStarter.java:53)
Caused by: java.io.FileNotFoundException: C:UsersSHIVLI~1AppDataLocalTemptmp9485717536946276215.vnd.openxmlformats-officedocument.spreadsheetml.sheet (The system cannot find the file specified)
    at java.base/java.io.FileInputStream.open0(Native Method)
    at java.base/java.io.FileInputStream.open(FileInputStream.java:219)
    at java.base/java.io.FileInputStream.<init>(FileInputStream.java:157)
    at org.apache.poi.openxml4j.opc.ZipPackage.openZipEntrySourceStream(ZipPackage.java:159)
    ... 35 more
 

Обновление — Попробовал BytesHandle прочитать документ как байт [], а затем записать его в файловую систему, но, тем не менее, я получаю ту же ошибку «Файл поврежден и не может быть открыт».

         BytesHandle readHandle = new BytesHandle();
        readHandle.setMimetype("application/vnd.openxmlformats-officedocument.spreadsheetml.sheet");
        readHandle.setFormat(Format.BINARY);
        readHandle.set(BYTES_BINARY);

        byte[] file = manager.read("/test/binaryDoc.xlsx", readHandle).get();

        File outputFile = new File("outputFile.xlsx");

        OutputStream os = new FileOutputStream(outputFile);
        os.write(file);
        os.close();
 

Файл Excel сохраняется в файловой системе
введите описание изображения здесь

Я не понимаю, какой неправильный шаг я здесь делаю,

Может ли кто-нибудь помочь мне решить эту проблему?

Комментарии:

1. В приведенной выше трассировке ошибок исключение, которое является основной причиной, по-видимому, заключается в том, что файл не найден FileInputStream . Что указывает на то, что файл поврежден?

2. Спасибо @ehennum, файл есть в моей системе, смотрите Прикрепленное изображение здесь, но я не могу его открыть

3. Может быть, приложение Java не запущено от имени пользователя с разрешением на открытие файла в файловой системе? Если вы не можете открыть файл, возможно, проблема не связана с кодировкой.

Ответ №1:

Судя по описанию, проблема, по-видимому, заключается в том, что извлечение документа и запись в ОС работают некорректно, поскольку он показывает поврежденный файл. Я не разработчик Java, но, похоже, вы пытаетесь получить доступ к документу, как если бы это был обычный документ, а не двоичный файл. Для двоичных файлов, похоже, вам нужно либо передать двоичный файл в потоковом режиме, либо буферизировать его с помощью com.marklogic.client.io.BytesHandle

При чтении содержимого из двоичного документа показано несколько примеров. Следующий пример выглядит наиболее близким к тому, что вы пытаетесь сделать:

 byte[] buf = docMgr.read(docID, new BytesHandle()).get();
 

Я бы также предложил исключить передачу документа в XSSFWorkbook.java до тех пор, пока вы не сможете убедиться, что сохраняете действительные файлы во временном расположении, чтобы упростить процесс устранения неполадок.

Комментарии:

1. Спасибо @Michael Gardner за ваш ответ. Я обновил свой вопрос, пожалуйста, взгляните, как вы упомянули, я пытался использовать BytesHandle, но все же я получаю сообщение об ошибке при открытии загруженного файла.

Ответ №2:

Если вы просто хотите прочитать / записать файл xlsx, пожалуйста, используйте приведенное ниже Class представление входного потока в виде байтов вместо чтения двоичного файла в виде строки.

 InputStreamHandle handle = new InputStreamHandle();
handle.set(docStream);

docMgr.write(uri, handle);
 

Пожалуйста, подтвердите достоверность записанных данных, потока управления и условий перед дальнейшими манипуляциями.

Параметры проверки:

  • Используйте двоичный пакет Java, распространенное средство в среде тестирования, чтобы утверждать, что входные данные записываются без потерь:
 > Task :fc-financial-asset:TypedWriteReadStreamTest.main()

 Document /dmsdk/FXD.xlsx write completed.

 Assert /dmsdk/FXD.xlsx Input Stream and File BYTE – 

InputStream /dmsdk/FXD.xlsx bytes: 
11614

Calculate /dmsdk/FXD.xlsx byte array: 
11614

Read /dmsdk/FXD.xlsx file bytes:
11614
 
  • Переименуйте tmp*****.spreadsheetml.sheet в tmp*****.spreadsheetml.xlsx , вы должны иметь возможность открыть действительный excel.
  • save или проверьте документ из QConsole.