#mean #standard-deviation
Вопрос:
Итак, скажем, у меня было 2 набора данных (каждый набор данных представляет собой набор значений, и каждый имеет стандартное отклонение).
Я хочу найти среднюю разницу между двумя наборами данных по элементам, например ((element1_set1 — element1_set2) (element2_set1 — element2_set2)) / 2 для двух наборов данных длины 2.
Означает ли это, что я должен добавить стандартные отклонения по элементам, а затем найти их среднее значение, чтобы получить общее стандартное отклонение?
Или я просто нахожу среднее значение и std массива [element1_set1 — element1_set2, element2_set1 — element2_set2]?
Ответ №1:
Я действительно не понимаю, почему вы смешиваете там стандартное отклонение.
Чтобы получить разницу в среднем, вы можете просто вычесть среднее значение. Это работает из-за следующего (предполагая, что x являются элементами первого набора данных, а y-элементами второго):
Но это не работает со стандартным отклонением из-за квадратов.
Комментарии:
1. Спасибо за ответ. Я действительно запутываюсь, как будто существует несколько стандартных отклонений, мы должны исключить все. Однако, если стандартное отклонение является результатом ошибки того же типа, разве мы не должны их включать?
2. Что я хотел сказать относительно стандартного отклонения: создайте третий набор данных, содержащий различия. Возьмите стандартное отклонение нового набора данных. Я думаю, что это лучший и самый прямой путь. Игнорируйте стандартные отклонения, рассчитанные для наборов данных 1 и 2.
3. Я понимаю, спасибо. Итак, можете ли вы просто использовать std конечного набора данных, потому что есть только один источник ошибок? Если бы их было больше одного, вам пришлось бы принимать во внимание ЗППП каждого отдельного набора?
4. Нет, насколько я могу судить, нет. Отклонение std набора данных различий будет включать все различия, которые есть в различиях двух наборов данных.