Построение графиков и представление данных

#python #matplotlib #seaborn

#python #matplotlib #seaborn

Вопрос:

Сегодня меньше технических вопросов:

Каковы наилучшие способы группировки df для нескольких графиков в разных областях python?

Мне нужно создать «ежеквартальную презентацию» и отстой в построении графиков в Excel.

Я очистил свой df, чтобы иметь возможность нарезать по дате, сумме по продажам за год, продажам по месяцам и сравнивать с прошлым годом, делать цифры с начала года и т.д…

Кроме того, я хочу иметь возможность делать это по типу продукта и типу упаковки. Топ-5 по количеству клиентов, общему объему продаж, прибыли и т.д…

Создал мультииндекс по годам и месяцам для продаж, затрат и общих показателей, но нарезка или использование .xs или unstack для построения графика дают мне дерьмовые варианты для создания хороших графиков.

Как люди группируют данные для максимальной гибкости и наилучшего потенциала построения графиков?

Улучшенная визуализация

Индекс — это дата продажи

столбцы =[‘Клиент’, ‘Сумма продажи’, ‘Название продукта’, ‘Продукт’, ‘Тип упаковки’, количество’, ‘Стоимость’, ‘Прибыль’]

20 000 строк

Есть какие-нибудь советы / видео по представлению финансовых данных с использованием Jupyter / Python?

Ответ №1:

Для обработки данных и загрузки в data (т.е. загрузка csv-файлов):
Используйте библиотеки Pandas и NumPy

Для создания легких, неинтерактивных графиков, которые можно легко загрузить:
Используйте библиотеку matplotlib

Для создания интерактивных графиков (т. е. поддержка масштабирования и наведения курсора мыши на данные):
Используйте библиотеку Plotly

Если вам понадобится какая-либо конкретная помощь, как только вы начнете писать код, не стесняйтесь задать другой вопрос, и я был бы рад помочь!

Комментарии:

1. Я написал код, очищающий данные. Заключительные строки выглядят так: main_cogs = main_cogs.set_index(‘Дата’) fin_graph = main_cogs.groupby([(main_cogs.index.year), (main_cogs.index.month)]).sum() Это, очевидно, одна небольшая часть того, что мне нужно.

2. Проблема в том, что я не могу разделить данные в Multi_Index выше, чтобы я мог использовать их как данные в двух прямых переменных. В нем говорится, что форма не будет соответствовать. matplotlib.org/gallery/lines_bars_and_markers/… Использованное разделение: #Не сработало при разделении данных для сопоставления на графике # fs_19 = fin_graph.loc[2019, срез (7), все][‘Продажи’] # fs_20 = fin_graph.loc [2020, срез(7), все] [‘Продажи’] Я попытался использовать эти переменные для построения графиков.

3. @chasedcribbet Не могли бы вы, пожалуйста, опубликовать свой код и некоторые примеры выходных данных в другом вопросе? Форматирование там лучше, чем в этих комментариях, поэтому его легче понять. Спасибо!

4. Я скоро опубликую это