Чтение csv-файла с помощью R и RStudio

#r #csv

#r #csv

Вопрос:

Я пытаюсь прочитать файл csv в R, но получаю некоторые ошибки. Это то, что у меня есть, а также я установил правильный путь

 mydata <- read.csv("food_poisioning.csv")
  

Но я получаю эту ошибку

 Error in make.names(col.names, unique = TRUE) : 
  invalid multibyte string at '<ff><fe>Y'
In addition: Warning messages:
1: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 1 appears to contain embedded nulls
2: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  line 2 appears to contain embedded nulls
  

Я полагаю, что получаю эту ошибку, потому что мой csv-файл на самом деле не разделен запятой, но в нем есть пробелы. Вот как это выглядит:
введите описание изображения здесь

Я пытался использовать sep=» «, но это не сработало.

Комментарии:

1. Возможно, попробуйте read.table("food_poisioning.csv", header = TRUE) . Или, может быть sep = "t"

2. Похоже, это проблема с кодировкой. Похоже, что ваш файл представляет собой файл UTF с маркером порядка байтов (BOM). Может быть, попробовать mydata <- read.csv("food_poisioning.csv", encoding = "UCS-2LE")

3. Все еще не работает

4. Знаете ли вы, какая кодировка использовалась в файле? Откуда вы это взяли? Какую операционную систему вы используете? Вам нужно знать, как был закодирован файл, чтобы правильно его открыть.

Ответ №1:

Если у вас возникли трудности с использованием read.csv() или read.table() (или написанием других команд импорта), попробуйте использовать кнопку «Импортировать набор данных» на панели среды в RStudio. Это особенно полезно, когда вы не уверены, как указать формат таблицы или когда формат таблицы сложный.

Для вашего CSV-файла используйте «Из текста (readr) …» Опция импорта набора данных на панели среды

Появится окно, в котором вы сможете выбрать файл / URL для загрузки.
После выбора файла / URL-адреса вы увидите предварительный просмотр таблицы данных.
Вы можете щелкнуть по именам столбцов, чтобы изменить класс столбца, или даже «пропустить» столбцы, которые вам не нужны.
Используйте параметры импорта для дальнейшего управления вашими данными.

Вот пример использования CreditCard.csv из проектов Винсента Арел-Бандока на Github:

Окно импорта текстовых данных

Вы также можете изменить и / или скопировать и вставить код в Code Preview или нажать Импорт, чтобы запустить код, когда вы будете готовы.