#python #pandas #numpy #scipy #statistics
Вопрос:
Допустим, у меня есть следующий фрейм данных:
df = pd.DataFrame([['x', 42, 50, 68, 12],
['y', 51, 60, 79, 22],
['z', 43, 50, 58, 12],
['w', 46, 70, 88, 22],
['xy', 38, 40, 69, 22],
['xz', 39, 40, 49, 12]],
columns=['system', 'Experimental', 'Prediction1', 'Prediction2', 'Prediction3'])
Как я могу вычислить ошибку со знаком? Я вообще не смог найти никакой информации об этом.
Комментарии:
1. Это недопустимый конструктор фреймов. И что означает ошибка со знаком, которую вы ищете?
2. Честно говоря, я даже не знаю точно, что означает ошибка с подписью. Я не смог найти никакой информации об этом
3. Средняя ошибка со знаком, более известная как Среднее отклонение со знаком, в основном совпадает со Среднеквадратичной ошибкой, за исключением того, что каждый член не является квадратом. Пожалуйста, посмотрите ссылку в моем ответе, чтобы понять, что я имею в виду.
Ответ №1:
Я предполагаю, что вы хотите рассчитать эту статистику. Если это так, вы можете определить свою собственную функцию, а затем передать свои прогнозы для сравнения с наблюдаемыми значениями.
Вы не упомянули, в каком столбце df
находится наблюдаемое значение зависимой переменной, поэтому я предполагаю, что это Experimental
так, и я сравниваю его с Prediction1
этим .
# Define custom function
def msd(y_true, y_pred):
return (y_pred - y_true).mean()
# Mean Signed Deviation of 'Experimental' and 'Prediction1'
msd(df['Experimental'], df['Prediction1'])
> 8.5