#apache-spark #spark-dataframe #sparkr
#apache-spark #apache-spark-sql #sparkr
Вопрос:
Я пытаюсь написать SparkDataFrame с помощью SparkR.
write.df(spark_df,"/mypartition/enablers/Prod Data/data2/tempdata/tempdata_l2/","csv")
Но получаю следующую ошибку-
InsertIntoHadoopFsRelationCommand: Aborting job.
java.io.IOException: Failed to rename DeprecatedRawLocalFileStatus{path=file:/mypartition/enablers/Prod Data/data2/tempdata/tempdata_l2/_temporary/0/task_201610040736_0200_m_000112/part-r-00112-c4c5f30e-343d-4b02-a0f2-e9e5582047e5.snappy.parquet; isDirectory=false; length=331279; replication=1; blocksize=33554432; modification_time=1475566611000; access_time=0; owner=; group=; permission=rw-rw-rw-; isSymlink=false} to file:/mypartition/enablers/Prod Data/data2/tempdata/tempdata_l2/part-r-00112-c4c5f30e-343d-4b02-a0f2-e9e5582047e5.snappy.parquet
at org.apache.hadoop.mapreduce.lib.output.FileOutputCommitter.mergePaths(FileOutputCommitter.java:371)
Кроме того, также появляется следующая ошибка-
WARN FileUtil: Failed to delete file or dir [/mypartition/enablers/Prod Data/data2/tempdata/tempdata_l2/_temporary/0/task_201610040736_0200_m_000110/.part-r-00110-c4c5f30e-343d-4b02-a0f2-e9e5582047e5.snappy.parquet.crc]: it still exists.
Заранее спасибо за вашу ценную информацию.
Комментарии:
1. Отправьте свою команду записи
2. write.df(spark_df,»/mypartition/enablers/Prod Data/data2/tempdata/tempdata_l2/»,»csv»)
3. какую версию spark вы используете?
4. Я использую Spark 2.0.0
Ответ №1:
Проблема решена с помощью пользователя root, изначально Spark пытался писать от имени root, но при удалении временного файла он использовал зарегистрированного пользователя, изменил зарегистрированного пользователя на root и решил проблему
Ответ №2:
Файл контрольной суммы не удален должным образом. Можете ли вы попробовать переименовать файл контрольной суммы (crc) и выполнить его повторно.
cd /mypartition/enablers/Prod Data/data2/tempdata/tempdata_l2/__temporary/0/task_201610040736_0200_m_000110/
mv .part-r-00110-c4c5f30e-343d-4b02-a0f2-e9e5582047e5.snappy.parquet.crc .part-r-00110-c4c5f30e-343d-4b02-a0f2-e9e5582047e5.snappy.parquet.crc_backup