Как рассчитать среднюю ошибку со знаком, используя фреймы данных pandas?

#python #pandas #numpy #scipy #statistics

Вопрос:

Допустим, у меня есть следующий фрейм данных:

 df = pd.DataFrame([['x',  42, 50, 68, 12],
                   ['y',  51, 60, 79, 22],
                   ['z',  43, 50, 58, 12],
                   ['w',  46, 70, 88, 22],
                   ['xy', 38, 40, 69, 22],
                   ['xz', 39, 40, 49, 12]],
                  columns=['system', 'Experimental', 'Prediction1', 'Prediction2', 'Prediction3'])
 

Как я могу вычислить ошибку со знаком? Я вообще не смог найти никакой информации об этом.

Комментарии:

1. Это недопустимый конструктор фреймов. И что означает ошибка со знаком, которую вы ищете?

2. Честно говоря, я даже не знаю точно, что означает ошибка с подписью. Я не смог найти никакой информации об этом

3. Средняя ошибка со знаком, более известная как Среднее отклонение со знаком, в основном совпадает со Среднеквадратичной ошибкой, за исключением того, что каждый член не является квадратом. Пожалуйста, посмотрите ссылку в моем ответе, чтобы понять, что я имею в виду.

Ответ №1:

Я предполагаю, что вы хотите рассчитать эту статистику. Если это так, вы можете определить свою собственную функцию, а затем передать свои прогнозы для сравнения с наблюдаемыми значениями.

Вы не упомянули, в каком столбце df находится наблюдаемое значение зависимой переменной, поэтому я предполагаю, что это Experimental так, и я сравниваю его с Prediction1 этим .

 # Define custom function
def msd(y_true, y_pred):
    return (y_pred - y_true).mean()

# Mean Signed Deviation of 'Experimental' and 'Prediction1'
msd(df['Experimental'], df['Prediction1'])
> 8.5