Как сортировать и создавать точки данных суммы за тот же год из диаграммы с использованием pandas? Форматы года как etc. 2018,2019

#python #pandas #csv #static

#python #pandas #csv #статический

Вопрос:

Я пытаюсь отсортировать диаграмму с информацией о летных происшествиях. Итак, в csv-файле указаны разные авиакомпании, год аварии и множество других вещей. Я хочу суммировать все инциденты по годам и добавлять другую диаграмму по каждому году и каждой авиакомпании:

Желаемый результат первого графика:

год инциденты
2012 11
2013 12

Желаемый результат второй диаграммы:

год инциденты Авиакомпания
2011 23 Объединенный
2011 20 Гавайи
2011 30 Объединенный

Я пытался использовать dt.year , но это не работает. Потому что год csv указан в формате 2018,2019, а не в 2018-10-12. Я не могу использовать его в качестве информации о дате.

Комментарии:

1. Что вы подразумеваете под диаграммой?

Ответ №1:

Попробуйте:

 import matplotlib.pyplot as plt

# Per year
df.value_counts('year').plot()

# Per year, for each company
df.value_counts(['year', 'Airline']).unstack('Airline').plot(kind='bar')

plt.show()
 

Комментарии:

1. Привет, большое спасибо за помощь. Это вроде как работает. Но оказалось, что это сообщение об ошибке Tight layout not applied. The bottom and top margins cannot be made large enough to accommodate all axes decorations.