#python-3.x #pandas #csv
Вопрос:
У меня есть csv-файл, содержащий 73 строки данных и 16 столбцов, и я хочу прочитать его и передать в фрейм данных pandas, но когда я это сделаю
data_dataframe = pd.read_csv(csv_file, sep = ',')
Я получаю 3152 строки и 22 столбца с 73 строками и 16 столбцами данных, а остальные-просто чистые значения NaN. Как я могу сказать пандам, чтобы они читали действительные данные строк и столбцов и избегали всех этих дополнительных NaN?
Ответ №1:
Во-первых, сделайте визуализацию всех данных
import seaborn as sn sn.heatmap(data_dataframe.isna())
и затем, если вы хотите удалить строки, в которых есть «nan», используйте
data_dataframe.dropna()
и если вы хотите удалить непрерывные строки, используйте (по умолчанию ось = 0, поэтому указывать ее не нужно)
data_dataframe.drop(index = data_dataframe.index[1:3], inplace = True)
и если вы хотите удалить какие-либо конкретные строки, используйте
data_dataframe.drop(index = [1,3,5], inplace = True)
Ответ №2:
Для этого есть простая функция:
учитывая фрейм данных df
, используйте следующую df. dropna()
функцию.