#python
#python
Вопрос:
Я пытаюсь создать дельта-таблицу в databricks. Я использую эту ссылку в качестве ссылки для обучения.Здесь упоминается, что для всех типов файлов мне нужно считывать файлы в фрейм данных и записывать в дельта-формате :. Итак, я написал следующий код на python
import pandas as pd
df=pd.read_csv('my file path/data.csv')
df.write.format("delta").save("/mnt/delta/df")
spark.sql("CREATE TABLE df USING DELTA LOCATION '/mnt/delta/df/'")
Но я получил сообщение об ошибке
'DataFrame' object has no attribute 'write'
Не могли бы вы помочь мне решить проблему?
Комментарии:
1. Почему бы не выгрузить данные непосредственно в SQL с помощью
df.to_sql()
?2. @S3DEV, в настоящее время у меня нет доступа к какой-либо базе данных в databricks. Поэтому я решил использовать дельта-таблицу
3. вы нашли решение для своего ответа?
Ответ №1:
Надеюсь, это поможет
myCSV= spark.read.csv("/path/to/input/data",header=True,sep=",");
myCSV.write.format("delta").mode("overwrite").option('overwriteSchema','true').save("/mnt/delta/Employee")
spark.sql("CREATE TABLE employee USING DELTA LOCATION '/mnt/delta/Employee/'")