#python #python-3.x #pandas #csv
#python #python-3.x #pandas #csv
Вопрос:
Я написал этот код просто для того, чтобы показать пример, который у меня есть. Мне нужно сохранить имеющиеся у меня данные в csv, а затем снова открыть их позже, но когда я перезагружаю данные в pandas dataframe из csv, теперь спереди появляется дополнительный неназванный столбец, который мне не нужен, и он портит мои данные, когда я пытаюсь выполнить .drop_duplicates(), потому что каждыйстрока теперь имеет свой собственный номер, и каждый раз, когда я снова открываю ее из csv, в начале будет новая строка с номером, что только ухудшает ситуацию. Как мне сделать так, чтобы в нем этого не было?
import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randn(100,4), columns=list('ABCD'))
df.to_csv('data.csv')
print(df.head())
df1 = pd.read_csv('data.csv')
print(df1.head())
Комментарии:
1.
df.to_csv('data.csv', index=False)
Ответ №1:
Это индекс фрейма данных. Вы можете отключить это с помощью
df.to_csv('data.csv', index=False)
Документы — это первая остановка для изучения различных вариантов, которые у вас есть при написании. pandas.DataFrame.to_csv
Ответ №2:
Во время чтения вы можете запретить столбцы с пустыми строками, например:
df = pd.read_csv("data.csv").dropna()
Ответ №3:
Решение было очень простым. Мне нужно было сделать
df.to_csv(‘data.csv’, index= False)