Проверка неправильного заголовка Zlib при распаковке

#javascript #node.js #zlib

#javascript #node.js #zlib

Вопрос:

Мне нужно получить zip-файл с сервера, извлечь его и передать его содержимое в другое место.

Однако при попытке извлечь его с помощью createInflate из встроенного пакета zlib я получаю сообщение об ошибке Error: incorrect header check

(Я тоже пробовал с createUnzip и createGunzip )

Загрузка файла с помощью cUrl и извлечение его с помощью unzip команды Linux работает корректно.

 $ unzip report.zip 
Archive:  report.zip
  inflating: report.csv
  
 $ zipinfo -v report.zip
[...]
  file system or operating system of origin:      MS-DOS, OS/2 or NT FAT
  version of encoding software:                   2.0
  minimum file system compatibility required:     MS-DOS, OS/2 or NT FAT
  minimum software version required to extract:   2.0
  compression method:                             deflated
  compression sub-type (deflation):               normal
  file security status:                           not encrypted
  extended local header:                          yes
[...]
  

Код, используемый для извлечения уже загруженного файла:

 const pipeline = promisify(stream.pipeline);

(async () => {
  const unzipper = createInflate();
  const sourceStream = fs.createReadStream('report.zip');
  const destStream = fs.createWriteStream('report.csv');

  await pipeline(sourceStream, unzipper, destStream);
})();
  

Обратите внимание, что ошибка одинакова при прямой передаче ответа и передаче результата createReadStream

Полный zipinfo -v :

 $ zipinfo -v report.zip
Archive:  report.zip
There is no zipfile comment.

End-of-central-directory record:
-------------------------------

  Zip archive file size:                       527 (000000000000020Fh)
  Actual end-cent-dir record offset:           505 (00000000000001F9h)
  Expected end-cent-dir record offset:         505 (00000000000001F9h)
  (based on the length of the central directory and its expected offset)

  This zipfile constitutes the sole disk of a single-part archive; its
  central directory contains 1 entry.
  The central directory is 78 (000000000000004Eh) bytes long,
  and its (expected) offset in bytes from the beginning of the zipfile
  is 427 (00000000000001ABh).


Central directory entry #1:
---------------------------

  report_SMS_1f7c2069_20200730.csv

  offset of local header from start of archive:   0
                                                  (0000000000000000h) bytes
  file system or operating system of origin:      MS-DOS, OS/2 or NT FAT
  version of encoding software:                   2.0
  minimum file system compatibility required:     MS-DOS, OS/2 or NT FAT
  minimum software version required to extract:   2.0
  compression method:                             deflated
  compression sub-type (deflation):               normal
  file security status:                           not encrypted
  extended local header:                          yes
  file last modified on (DOS date/time):          2020 Jul 30 11:05:48
  32-bit CRC value (hex):                         5abe6238
  compressed size:                                349 bytes
  uncompressed size:                              934 bytes
  length of filename:                             32 characters
  length of extra field:                          0 bytes
  length of file comment:                         0 characters
  disk number on which file begins:               disk 1
  apparent file type:                             binary
  non-MSDOS external file attributes:             000000 hex
  MS-DOS file attributes (00 hex):                none

  There is no file comment.
  

Ответ №1:

zlib не является zip. zip-это не zlib. Это два разных формата. gzip — это еще один. (Использование слова «разархивировать» в node.js интерфейс zlib вводит в заблуждение.)

Вам нужно что-то, что разархивирует zip-файлы. Взгляните на это.

Комментарии:

1. Метод сжатия сдут, поэтому можно подумать, что распаковка inflate сработает.

2. Будут ли zlib и zip считаться сериализациями сжатия / декомпрессии?

3. Функция раздувания и распаковки работает , если вы декодируете формат zip, чтобы найти в нем данные, сжатые с помощью deflate, для каждой записи. Это предполагает, что zip-файл использует метод сжатия deflate из более чем дюжины возможных. Однако 99,9% существующих zip-файлов используют либо методы сжатия deflate, либо хранимые методы сжатия (хранимый — это не сжатие).

4. zlib, zip, gzip, tar.gz , и т.д. являются оболочками вокруг сжатых данных, где оболочки предоставляют метаданные и проверки целостности содержимого.