агрегирование данных с помощью sum pandas / python

#python #pandas #dataframe #csv #analytics

#python #pandas #фрейм данных #csv #аналитика

Вопрос:

 import pandas as pd
dane= pd.read_csv('WHO-COVID-19-global-data _2.csv')
dane

dane.groupby('Country')[['Cumulative_cases']].sum()
  

Ключевая ошибка: «Страна»

Я не знаю, почему этот код не запускается?

Комментарии:

1. Пожалуйста, предоставьте некоторые примеры данных фрейма данных dane

2. covid19.who.int/table

3. Внешние ссылки могут стать недействительными, лучше покажите их как правильно отформатированный текст в вопросе.

4. Дата сообщения, Код страны, Страна, WHO_region, New_cases, Cumulative_cases, New_deaths, Cumulative_deaths 2020-01-03,AF, Афганистан, EMRO,0,0,0,0 2020-01-04, AF, Афганистан, EMRO,0,0,0,0 2020-01-05, ВС, Афганистан, EMRO,0,0,0,0

Ответ №1:

В начале столбцов dane есть пробелы

Удалите их с помощью следующей строки:

 dane.rename(columns=lambda x: x.strip(), inplace=True)    
dane.groupby('Country')[['Cumulative_cases']].sum()

                                             

    Cumulative_cases
 Country
Afghanistan                                                   5702767
Albania                                                       1300156
Algeria                                                       5561691
American Samoa                                                      0
Andorra                                                        273756
...                                                               ...
Wallis and Futuna                                                  14
Yemen                                                          256353
Zambia                                                        1323403
Zimbabwe                                                       692447
occupied Palestinian territory, including east ...            4057017
  

Комментарии:

1. он запускается, большое спасибо, как избежать этой проблемы? есть ли какая-либо функция для удаления пробелов перед именами переменных? или я должен сделать это вручную, например, в Excel?

2. Я добавляю еще одну строку в начале, которая удаляет пробелы