Почему Redshift Spectrum показывает имя файла в первом столбце?

#amazon-web-services #amazon-redshift #amazon-redshift-spectrum

#amazon-web-services #amazon-redshift #amazon-redshift-spectrum

Вопрос:

Я пытаюсь настроить AWS Redshift Spectrum для чтения некоторых данных, которые находятся в корзине S3. Файлы хранятся в формате gzipped (tar.gz ) CSV-файлы с именем файла, например 12345.csv.tar.gz .

Я следовал инструкциям здесь, чтобы настроить внешнюю схему и таблицу.

Когда я выполняю базовый запрос (ВЫБЕРИТЕ * ИЗ schema.table ), я получаю данные обратно, но первый столбец — это имя файла с набором цифр после него, а не данные в CSV. Все остальные столбцы в порядке.

Я попробовал эксперимент с некоторыми из тех же данных, которые не были сжаты, и запрос возвращает данные, как и ожидалось. Эта проблема возникает только тогда, когда я загружаю файлы gzip.

Что я упускаю?