#amazon-web-services #amazon-redshift #amazon-redshift-spectrum
#amazon-web-services #amazon-redshift #amazon-redshift-spectrum
Вопрос:
Я пытаюсь настроить AWS Redshift Spectrum для чтения некоторых данных, которые находятся в корзине S3. Файлы хранятся в формате gzipped (tar.gz ) CSV-файлы с именем файла, например 12345.csv.tar.gz .
Я следовал инструкциям здесь, чтобы настроить внешнюю схему и таблицу.
Когда я выполняю базовый запрос (ВЫБЕРИТЕ * ИЗ schema.table ), я получаю данные обратно, но первый столбец — это имя файла с набором цифр после него, а не данные в CSV. Все остальные столбцы в порядке.
Я попробовал эксперимент с некоторыми из тех же данных, которые не были сжаты, и запрос возвращает данные, как и ожидалось. Эта проблема возникает только тогда, когда я загружаю файлы gzip.
Что я упускаю?