#apache-spark #pyspark #azure-databricks
Вопрос:
Может кто-нибудь показать мне, как сделать заголовок первой строки=True с помощью Apache Spark в базах данных с помощью magic SQL.
Код, который я использую, это
%sql CREATE OR REPLACE VIEW enrraces.race_circuits_df AS SELECT * FROM csv.`/FileStore/tables/results.csv`
Я просто хочу сделать первую строку заголовком.
Спасибо
Ответ №1:
Попробуй это —
%sql CREATE OR REPLACE VIEW enrraces.race_circuits_df USING CSV OPTIONS (path "/FileStore/tables/results.csv", header "true"); SELECT * FROM enrraces.race_circuits_df
или
%sql USE enrraces; CREATE OR REPLACE VIEW race_circuits_df USING CSV OPTIONS (path "/FileStore/tables/results.csv", header "true"); SELECT * FROM race_circuits_df
Комментарии:
1. Привет, Ассаф, я получаю следующую ошибку: == SQL == СОЗДАЙТЕ ИЛИ ЗАМЕНИТЕ ПРЕДСТАВЛЕНИЕ enrraces.race_circuits_df, ИСПОЛЬЗУЯ ПАРАМЕТРЫ CSV ^ ^ ^ (путь «/Хранилище файлов/таблицы/результаты.csv», заголовок «true») КАК ВЫБРАТЬ * ИЗ csv.
/FileStore/tables/results.csv
2. На самом деле, полная ошибка заключается в:
mismatched input 'USING' expecting {'(', 'AS', 'COMMENT', 'PARTITIONED', 'TBLPROPERTIES'}(line 2, pos 0) == SQL == CREATE OR REPLACE VIEW enrraces.race_circuits_df USING CSV ^^^ OPTIONS (path "/FileStore/tables/results.csv", header "true") AS SELECT * FROM csv.`/FileStore/tables/results.csv
3. @Patterson можете ли вы попробовать любое из решений, которые я только что добавил? отредактировал мой ответ.
4. Привет, это сработало для меня
%sql create table if not exists enrraces.race_circuits_df using csv options ('header' = 'true') location "/FileStore/tables/results.csv"
5. отлично! @Паттерсон