Как применить тренд-тест Кокрана-Армитиджа в R

#r #statistics

#r #Статистика

Вопрос:

Я работаю над публикацией, в которой рассматривается растущее авторство меньшинств для определенных статей. Существует четкая тенденция к увеличению, но я хотел применить некоторую статистическую строгость. Мой фрейм данных прост: годы и% авторства меньшинства. Однако входной фрейм данных Кокрана-Армитиджа не имеет смысла в моем контексте. Правильно ли я использую тест?

Я усовершенствовал фрейм данных и подготовил его, указав количество лет по оси x и% авторства меньшинства по оси y. по сути, 1 строка и 10 столбцов (каждый столбец представляет один год). Однако cochran-armitage не может принимать 1-строчные фреймы данных

мой фрейм данных существует как so

year 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018
race 11.1 12.1 14.2 15.2 19.2 20.5 21.8 27.9 30.1 31.1

Комментарии:

1. Согласно википедии, Кокрейн Армитидж предназначен для связи между переменной с 2 категориями и порядковой переменной с K категориями. Я бы сказал, неправильный тест. Как насчет простой линейной регрессии? (возьмите% в качестве значения по оси Y …)

2. Я могу создать дополнительную категорию, которая, по сути, дополняет то, что у меня есть. Интерпретируется как не меньшее (т. Е. Значение 1). Это аналогичная статья, в которой он использовался thespinejournalonline.com/article/S1529-9430 (17)30315-7/. … Могу ли я использовать линейную регрессию, чтобы подразумевать растущую тенденцию? Подходит ли простая линейная регрессия в этой ситуации?

3. Я бы сказал, да, тенденция довольно сильная. У вас не так много очков, но это кажется значительным. Я включу это в ответ…

4. Что касается статьи, на которую вы ссылались — кокрейновский Армитидж там более уместен, поскольку у них есть 2 категории (женский / мужской) и порядковый номер с k переменными (первый, средний, последний). Вот почему они могут применить тест в своей ситуации, в вашей у вас есть 2 категории, но нет порядковых переменных.

5. Вы анализируете проценты как результат, поэтому он по определению не будет распределяться нормально. Бета-регрессия с большей вероятностью соответствует распределению процентов, поскольку бета-распределения имеют границы 0 и 1.

Ответ №1:

Кокрейновский Армитидж, вероятно, является неправильным тестом, он предназначен для сопоставления переменной с 2 категориями и порядковой переменной с K категориями. У вас есть две переменные, каждая из которых имеет одну категорию.

Я думаю, что сработает простая линейная регрессия. Фактически, когда вы выполняете его на предоставленных вами данных (вам не хватает% за 2018 год, поэтому я удалил эту строку), вот что вы получаете:

 > summary(y_p)

Call:
lm(formula = year ~ percent, data = y_p)

Residuals:
 Min       1Q   Median       3Q      Max 
-0.77079 -0.38560 -0.03582  0.35535  0.90139 

Coefficients:
         Estimate Std. Error t value Pr(>|t|)    
(Intercept) 2.004e 03  5.428e-01 3692.52  < 2e-16 ***
percent     4.045e-01  2.526e-02   16.01 2.32e-07 ***
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.5586 on 8 degrees of freedom
Multiple R-squared:  0.9697,    Adjusted R-squared:  0.966 
F-statistic: 256.4 on 1 and 8 DF,  p-value: 2.319e-07
  

Для меня это выглядит довольно значительным, но вам нужно будет проверить остатки и т. Д., Чтобы быть уверенным.

Комментарии:

1. То, что вы не получаете ошибку, не дает уверенности в правильности вашего статистического анализа.

2. Я знаю об этом, но я ни в коем случае не статистик. Ваш комментарий относительно B-регрессии выглядит как лучшее решение проблемы OP