ошибка записи.df в sparkr

#apache-spark #spark-dataframe #sparkr

#apache-spark #apache-spark-sql #sparkr

Вопрос:

Я пытаюсь написать SparkDataFrame с помощью SparkR.

 write.df(spark_df,"/mypartition/enablers/Prod Data/data2/tempdata/tempdata_l2/","csv")
  

Но получаю следующую ошибку-

 InsertIntoHadoopFsRelationCommand: Aborting job.
java.io.IOException: Failed to rename DeprecatedRawLocalFileStatus{path=file:/mypartition/enablers/Prod Data/data2/tempdata/tempdata_l2/_temporary/0/task_201610040736_0200_m_000112/part-r-00112-c4c5f30e-343d-4b02-a0f2-e9e5582047e5.snappy.parquet; isDirectory=false; length=331279; replication=1; blocksize=33554432; modification_time=1475566611000; access_time=0; owner=; group=; permission=rw-rw-rw-; isSymlink=false} to file:/mypartition/enablers/Prod Data/data2/tempdata/tempdata_l2/part-r-00112-c4c5f30e-343d-4b02-a0f2-e9e5582047e5.snappy.parquet
    at org.apache.hadoop.mapreduce.lib.output.FileOutputCommitter.mergePaths(FileOutputCommitter.java:371)
  

Кроме того, также появляется следующая ошибка-

 WARN FileUtil: Failed to delete file or dir [/mypartition/enablers/Prod Data/data2/tempdata/tempdata_l2/_temporary/0/task_201610040736_0200_m_000110/.part-r-00110-c4c5f30e-343d-4b02-a0f2-e9e5582047e5.snappy.parquet.crc]: it still exists.
  

Заранее спасибо за вашу ценную информацию.

Комментарии:

1. Отправьте свою команду записи

2. write.df(spark_df,»/mypartition/enablers/Prod Data/data2/tempdata/tempdata_l2/»,»csv»)

3. какую версию spark вы используете?

4. Я использую Spark 2.0.0

Ответ №1:

Проблема решена с помощью пользователя root, изначально Spark пытался писать от имени root, но при удалении временного файла он использовал зарегистрированного пользователя, изменил зарегистрированного пользователя на root и решил проблему

Ответ №2:

Файл контрольной суммы не удален должным образом. Можете ли вы попробовать переименовать файл контрольной суммы (crc) и выполнить его повторно.

 cd /mypartition/enablers/Prod Data/data2/tempdata/tempdata_l2/__temporary/0/task_201610040736_0200_m_000110/

mv .part-r-00110-c4c5f30e-343d-4b02-a0f2-e9e5582047e5.snappy.parquet.crc .part-r-00110-c4c5f30e-343d-4b02-a0f2-e9e5582047e5.snappy.parquet.crc_backup