Не отображается разархивированный файл Google Colab

#google-colaboratory

#google-colaboratory

Вопрос:

Я загрузил некоторые наборы данных через Kaggle API в Colab. Однако после их распаковки они не отображаются в моем каталоге, и я могу прочитать их с помощью pandas

Команды Colab

Как вы можете видеть, файл успешно разархивирован, а затем я снова разархивирую их, поскольку не смог их найти. Однако, как я упоминал, они не отображаются в каталоге. Кроме того, pd.read_csv не удается прочитать ни те csv файлы, которые не отображаются, ни те, csv.zip которые отображаются с помощью compression = zip аргумента. Я получаю

 FileNotFoundError: File b'/data/train.csv' does not exist
FileNotFoundError: [Errno 2] No such file or directory: 'data/train.csv.zip'
  

Есть идеи, что происходит?

Ответ №1:

попробуйте распаковать их по отдельности, например

 !unzip train.csv.zip
  

затем выполните

 train = pd.read_csv('train.csv', nrows=6000000, dtype={'acoustic_data': np.int16, 'time_to_failure': np.float64})
  

Я получил это из репозитория github, для которого вы можете следовать инструкциям или просто импортировать в colab, а затем заменить его своими данными

https://github.com/llSourcell/Kaggle_Earthquake_challenge/blob/master/Earthquake_Challenge .ipynb

вы можете импортировать записные книжки .ipynb, выполнив их поиск в colab

Комментарии:

1. Спасибо. Я уже пытался разархивировать файлы по отдельности, но они все еще были недоступны.

2. у вас есть ссылка на ваш ноутбук colab, на который можно посмотреть?