#google-colaboratory
#google-colaboratory
Вопрос:
Я загрузил некоторые наборы данных через Kaggle API в Colab. Однако после их распаковки они не отображаются в моем каталоге, и я могу прочитать их с помощью pandas
Как вы можете видеть, файл успешно разархивирован, а затем я снова разархивирую их, поскольку не смог их найти. Однако, как я упоминал, они не отображаются в каталоге. Кроме того, pd.read_csv
не удается прочитать ни те csv
файлы, которые не отображаются, ни те, csv.zip
которые отображаются с помощью compression = zip
аргумента. Я получаю
FileNotFoundError: File b'/data/train.csv' does not exist
FileNotFoundError: [Errno 2] No such file or directory: 'data/train.csv.zip'
Есть идеи, что происходит?
Ответ №1:
попробуйте распаковать их по отдельности, например
!unzip train.csv.zip
затем выполните
train = pd.read_csv('train.csv', nrows=6000000, dtype={'acoustic_data': np.int16, 'time_to_failure': np.float64})
Я получил это из репозитория github, для которого вы можете следовать инструкциям или просто импортировать в colab, а затем заменить его своими данными
https://github.com/llSourcell/Kaggle_Earthquake_challenge/blob/master/Earthquake_Challenge .ipynb
вы можете импортировать записные книжки .ipynb, выполнив их поиск в colab
Комментарии:
1. Спасибо. Я уже пытался разархивировать файлы по отдельности, но они все еще были недоступны.
2. у вас есть ссылка на ваш ноутбук colab, на который можно посмотреть?