#r #csv #fread
Вопрос:
Мне трудно понять, что не так в моем импорте fread. Когда я использую read.csv с тем же параметром, данные считываются правильно, но я не могу их использовать, так как другие файлы с ними не работают.
ths<-read.csv(path_data, sep = ",",header = TRUE,stringsAsFactors = FALSE)
df <- data.table::fread(file=path_data,
header = TRUE,
sep = ",",quote = '',stringsAsFactors = FALSE)
Я не могу предоставить вам файл, поэтому вот образец данных:
> "hal-02409822,1,https://hal.archives-ouvertes.fr/hal-02409822,ART,10.1063/1.5127050,,Plasma
> diagnostic tools for ECR ion sources—What can we learn from these
> experiments for the next generation sources,,""O. Tarvainen,T.
> Kalvas,H. Koivisto,R. Kronholm,M. Marttinen,M. Sakildien,V.
> Toivanen,I. Izotov,V. Skalyga,J.
> Angot"",2019,2019,""0.phys,1.phys.phys,2.phys.phys.phys-acc-ph,0.phys"",Rev.Sci.Instrum.,,90,,113321,,,,,,""phys,phys"",,phys.phys.phys-acc-ph,en,false"
> "hal-02277876,1,https://hal.archives-ouvertes.fr/hal-02277876,ART,10.1103/PhysRevE.100.013205,,Physics
> of relativistic collisionless shocks: The scattering-center
> frame,,""Guy Pelletier,Laurent Gremillet,Arno Vanthieghem,Martin
> Lemoine"",2019,2019,""0.phys,1.phys.astr,0.phys,1.phys.phys,2.phys.phys.phys-gen-ph"",""Physical
> Review E : Statistical, Nonlinear, and Soft Matter Physics"",American
> Physical Society,100,,013205,,,,,Plasma Physics,""phys,phys"",Plasma
> Physics,phys.astr,en,false"
Комментарии:
1. Поскольку вы используете
header = TRUE
свои файлы, предусмотрена строка заголовка. Afaik для каждой строки требуется столько столбцов (разделенных,
), сколько в вашем заголовке. Глядя на ваш образец данных, я сомневаюсь, что это выполнено.2. @MartinGal Спасибо за ваше время, я тоже об этом подумал, и вы правы, в строке больше»,», чем в заголовке, но событие с заголовком=FALSE fread не работает, тогда как чтение csv, похоже, адаптируется. Это почему? есть ли параметр, который я могу указать для исправления фрейда?
3. Я думаю, что в каждой строке требуется одинаковое количество
,
. Возможно, вы могли бы попробовать с небольшим примером (две строки)? Глядя на ваш образец данных, я не думаю, что этот файл хорошо сформирован. Это выглядит так, как будто строка была разделена на несколько строк.4. на самом деле есть только rwo, но сообщение не позволяет мне поместить его в ту же строку извините, если вы срежете «»hal-0..» и внесете в ту же строку, у вас будет строка (я достаточно ясно выразился ?)