#python #pandas #dataframe #average
Вопрос:
У меня есть четыре кадра данных, каждый из которых структурирован так:
index 1 2 3 4 5 6 . . . n
Q1 # # # # #
Q2 #
Q3 #
Q4 #
Оба вопроса ( Q1
, Q2
,..) и диапазон чисел 1
— n
это индекс для моего фрейма данных
Я хочу взять среднее значение каждой строки данных, которое будет представлять собой средний балл за вопрос
index 1 2 3 4 5 6 . . . n average
Q1 # # # # # # avg_q1
Q2 # avg_q2
Q3 # .
Q4 # .
После того, как я возьму среднее значение для каждой строки df в каждой, я хочу сделать отдельные линейные графики для каждого вопроса в dfs и построить точки данных, если числовые значения ( Q#
) одинаковы. Таким образом, на некоторых вопросах может быть диаграмма с 4 точками, на некоторых-с двумя. Если возможно, я хотел бы также иметь где-то на графике среднее процентное изменение от первого df до последнего, где у них одинаковый Q#.
Ответ №1:
Вы задали много вопросов в вопросе ^^
Для начала вы можете взглянуть на это:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(100, 3))
df_mean = df.mean(axis=0)
for column in df.columns :
df.plot(y=column)
print(df_mean)
Ответ №2:
Вы можете получить среднее значение по каждому столбцу или строке с помощью df.mean()
Вы можете указать axis=0 или axis=1, чтобы https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.mean.html