Считывайте csv в фрейм данных pandas, но избегайте строк NaN

#python-3.x #pandas #csv

Вопрос:

У меня есть csv-файл, содержащий 73 строки данных и 16 столбцов, и я хочу прочитать его и передать в фрейм данных pandas, но когда я это сделаю

 data_dataframe = pd.read_csv(csv_file, sep = ',')  

Я получаю 3152 строки и 22 столбца с 73 строками и 16 столбцами данных, а остальные-просто чистые значения NaN. Как я могу сказать пандам, чтобы они читали действительные данные строк и столбцов и избегали всех этих дополнительных NaN?

Ответ №1:

Во-первых, сделайте визуализацию всех данных

 import seaborn as sn sn.heatmap(data_dataframe.isna())  

и затем, если вы хотите удалить строки, в которых есть «nan», используйте

 data_dataframe.dropna()  

и если вы хотите удалить непрерывные строки, используйте (по умолчанию ось = 0, поэтому указывать ее не нужно)

 data_dataframe.drop(index = data_dataframe.index[1:3], inplace = True)  

и если вы хотите удалить какие-либо конкретные строки, используйте

 data_dataframe.drop(index = [1,3,5], inplace = True)  

Ответ №2:

Для этого есть простая функция:

учитывая фрейм данных df , используйте следующую df. dropna() функцию.