#python #matplotlib #seaborn
#python #matplotlib #seaborn
Вопрос:
Сегодня меньше технических вопросов:
Каковы наилучшие способы группировки df для нескольких графиков в разных областях python?
Мне нужно создать «ежеквартальную презентацию» и отстой в построении графиков в Excel.
Я очистил свой df, чтобы иметь возможность нарезать по дате, сумме по продажам за год, продажам по месяцам и сравнивать с прошлым годом, делать цифры с начала года и т.д…
Кроме того, я хочу иметь возможность делать это по типу продукта и типу упаковки. Топ-5 по количеству клиентов, общему объему продаж, прибыли и т.д…
Создал мультииндекс по годам и месяцам для продаж, затрат и общих показателей, но нарезка или использование .xs или unstack для построения графика дают мне дерьмовые варианты для создания хороших графиков.
Как люди группируют данные для максимальной гибкости и наилучшего потенциала построения графиков?
Улучшенная визуализация
Индекс — это дата продажи
столбцы =[‘Клиент’, ‘Сумма продажи’, ‘Название продукта’, ‘Продукт’, ‘Тип упаковки’, количество’, ‘Стоимость’, ‘Прибыль’]
20 000 строк
Есть какие-нибудь советы / видео по представлению финансовых данных с использованием Jupyter / Python?
Ответ №1:
Для обработки данных и загрузки в data (т.е. загрузка csv-файлов):
Используйте библиотеки Pandas и NumPy
Для создания легких, неинтерактивных графиков, которые можно легко загрузить:
Используйте библиотеку matplotlib
Для создания интерактивных графиков (т. е. поддержка масштабирования и наведения курсора мыши на данные):
Используйте библиотеку Plotly
Если вам понадобится какая-либо конкретная помощь, как только вы начнете писать код, не стесняйтесь задать другой вопрос, и я был бы рад помочь!
Комментарии:
1. Я написал код, очищающий данные. Заключительные строки выглядят так: main_cogs = main_cogs.set_index(‘Дата’) fin_graph = main_cogs.groupby([(main_cogs.index.year), (main_cogs.index.month)]).sum() Это, очевидно, одна небольшая часть того, что мне нужно.
2. Проблема в том, что я не могу разделить данные в Multi_Index выше, чтобы я мог использовать их как данные в двух прямых переменных. В нем говорится, что форма не будет соответствовать. matplotlib.org/gallery/lines_bars_and_markers/… Использованное разделение: #Не сработало при разделении данных для сопоставления на графике # fs_19 = fin_graph.loc[2019, срез (7), все][‘Продажи’] # fs_20 = fin_graph.loc [2020, срез(7), все] [‘Продажи’] Я попытался использовать эти переменные для построения графиков.
3. @chasedcribbet Не могли бы вы, пожалуйста, опубликовать свой код и некоторые примеры выходных данных в другом вопросе? Форматирование там лучше, чем в этих комментариях, поэтому его легче понять. Спасибо!
4. Я скоро опубликую это