#python #pandas #plot #visualization #data-cube
#python #pandas #график #визуализация #куб данных
Вопрос:
Рассмотрим этот пример. У меня есть фрейм данных pandas с тремя «измерениями»: день, местоположение, идентификатор товара и некоторые значения, скажем, продажи и спрос.
Я хотел бы агрегировать продажи, вычислять и визуализировать статистику по обоим измерениям. Например, я могу агрегировать по элементу и вычислять для каждого дня и местоположения общий объем продаж и соотношение продаж к общему объему. У меня также могли бы быть более «креативные» ключевые показатели эффективности для вычисления, поэтому я также должен иметь возможность вычислять общие функции по агрегациям.
Я мог бы сделать несколько возможных агрегаций. Я мог бы агрегировать данные по местоположению, дню или элементу или по двум измерениям одновременно: местоположение и день, местоположение и элемент… У меня может быть много агрегатов для рассмотрения, поскольку я должен проверить у пользователей, как что-то, в этом примере «продажи», ведет себя, и нам нужно изучить несколько измерений, по крайней мере, на этом этапе разработки программного обеспечения.
Я сделал это с pandas и plotnine. Я создал соответствующие агрегации в виде фреймов данных с помощью pandas, а затем построил их.
Затем я хотел бы, чтобы мои диаграммы были интерактивными и простыми в использовании для пользователя.
Возможно, я мог бы что-то получить, используя pandas и plotly. Мне нужно проверить, насколько plotly совместим с plotnine
Однако мне интересно, не выглядит ли это больше как приложение BI. Или, в любом случае, если есть библиотека или программное обеспечение, которые позволили бы достичь того же результата при меньшем количестве кода, это необходимо поддерживать в нашей и без того большой базе кода.
Какие еще варианты, по вашему мнению, я должен оценить?
TIA