#python #pandas #csv #static
#python #pandas #csv #статический
Вопрос:
Я пытаюсь отсортировать диаграмму с информацией о летных происшествиях. Итак, в csv-файле указаны разные авиакомпании, год аварии и множество других вещей. Я хочу суммировать все инциденты по годам и добавлять другую диаграмму по каждому году и каждой авиакомпании:
Желаемый результат первого графика:
год | инциденты |
---|---|
2012 | 11 |
2013 | 12 |
Желаемый результат второй диаграммы:
год | инциденты | Авиакомпания |
---|---|---|
2011 | 23 | Объединенный |
2011 | 20 | Гавайи |
2011 | 30 | Объединенный |
Я пытался использовать dt.year
, но это не работает. Потому что год csv указан в формате 2018,2019, а не в 2018-10-12. Я не могу использовать его в качестве информации о дате.
Комментарии:
1. Что вы подразумеваете под диаграммой?
Ответ №1:
Попробуйте:
import matplotlib.pyplot as plt
# Per year
df.value_counts('year').plot()
# Per year, for each company
df.value_counts(['year', 'Airline']).unstack('Airline').plot(kind='bar')
plt.show()
Комментарии:
1. Привет, большое спасибо за помощь. Это вроде как работает. Но оказалось, что это сообщение об ошибке
Tight layout not applied. The bottom and top margins cannot be made large enough to accommodate all axes decorations.