#csv #apache-spark #hadoop #hive
#csv #apache-spark #hadoop #hive
Вопрос:
Я пытаюсь создать таблицу csv hive (используя Hive CLI) в S3.
create external table hello (
name INT)
stored as csv
location 's3://bucket/myfolder;
==> Ошибка SemanticException Unrecognized file format in stored as clause 'CSV'
Я удалил ВНЕШНИЙ
create table hello (
name INT)
stored as csv
location 's3://bucket/myfolder;
==> Та же ошибка SemanticException Unrecognized file format in stored as clause 'CSV'
Зная, что я использую Apache Hive Apache Hadoop (я установил его, потому что Hive нужны некоторые двоичные файлы hadoop).
У вас есть идея, пожалуйста, спасибо
Ответ №1:
CSV — недопустимый тип файла. Попробуйте это вместо:
create external table hello (
name INT)
row format delimited
fields terminated by ','
stored as textfile
location 's3://bucket/myfolder';
Или
create external table hello (
name INT)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as textfile
location 's3://bucket/myfolder';