#r #geometry #data-analysis
#r #геометрия #анализ данных
Вопрос:
Недавно я собрал данные с помощью инструмента NASA TLX, который включает в себя задачу отслеживания, в которой субъекты должны удерживать джойстик в мертвом центре, одновременно реагируя на несколько задач.
Исходные данные выглядят примерно так:
V2 V5 V6
1 9:10:32.799614 TRACK STATE CURSOR X -0.005495149786872552
2 09:10:32.801598 TRACK STATE CURSOR Y 0.11168536804754137
3 09:10:32.805621 TRACK STATE CURSOR X -0.005616917142611262
4 09:10:32.807115 TRACK STATE CURSOR Y 0.11102381417330846
Координата x показывает, насколько далеко от объекта находился объект по координате x, тогда как y показывает ось y.
Теперь для моего анализа я решил использовать
df_track <- df_all %>%
filter(V2 == "TRACK") %>%
group_by(Proband, Teil, V5) #%>%
summarise(Precisetrack = median(abs(as.numeric(V6)), na.rm = T))
for (i in 1:nrow(df_track)) {if(i %% 2!=1) {
df_track$Avgs[i]<-
(df_track$Precisetrack[i] df_track$Precisetrack[i-1])/2
}
}
Просматривая свой код и просматривая свои результаты, я наткнулся на среднее геометрическое и некоторые разногласия по поводу того, следует ли мне использовать медиану или среднее значение. Есть ли кто-нибудь, кто, возможно, мог бы дать мне некоторое представление о том, является ли мой анализ несколько достоверным?
Комментарии:
1. Обсуждение того, следует ли использовать медиану или среднее значение, на самом деле не является конкретным вопросом программирования, который подходит для переполнения стека. Если вам нужна помощь в выборе методов для вашего анализа, вам следует вместо этого задать в Cross Validated where статистические вопросы по теме.
2. @MrFlick спасибо за предложенное редактирование, а также за ссылку на перекрестную проверку!