Как сравнить данные о температуре за определенный период времени

#r #period #microclimate

#r #период #микроклимат

Вопрос:

Моя цель — оценить влияние обработки (на данные о микроклимате), примененной к навесу, по сравнению с контролем. Поэтому я поместил три регистратора данных в купол на 5 площадках и в каждом варианте («применяемая обработка» или «контроль»). Данные усредняются каждые 5 минут за период в 217 дней. Зарегистрированные данные выглядят следующим образом:

 Timepoint,Time,Celsius(°C),Humidity(%rh),dew point(°C)
1,27/03/2019 17:02:39,23.5,37.5,8.2
2,27/03/2019 17:07:39,23.5,36.5,7.8
3,27/03/2019 17:12:39,23.5,36.5,7.8
4,27/03/2019 17:17:39,24.0,37.5,8.6
5,27/03/2019 17:22:39,23.5,36.0,7.6
6,27/03/2019 17:27:39,23.0,37.0,7.5
7,27/03/2019 17:32:39,22.5,34.5,6.1
8,27/03/2019 17:37:39,22.5,34.5,6.1
  

Записи суммируются ежедневно, чтобы получить среднюю / максимальную / минимальную температуру за каждый из 217 дней. Независимо от сайта я хочу определить эффект применяемой обработки и выявить различия с течением времени.

Мне сказали, что анализ временных рядов здесь не работает. Я попытался применить линейную регрессию (вдохновленный этой статьей:https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0234436 ) по данным, но поскольку контроль не влияет на обработку, я отказался от этого подхода.

Итак, мой вопрос: какой метод был бы правильным способом анализа этих микроклиматических данных в R?

Комментарии:

1. Если я правильно понимаю, у вас есть 10 фреймов данных (по 2 для каждого сайта). И у вас есть 217 строк в каждом фрейме данных (как количество дней). Вы хотите сравнить данные из контроля с обработкой?

2. Да, это верно. Но я также хочу избавиться от «эффекта сайта», чтобы получить эффект только от обработки. Я уже провел предварительный анализ, в котором я вычел каждую точку данных обработки из контрольной. Но я хочу получить статистические различия / создать статистическую модель.

Ответ №1:

Вы можете попробовать выполнить линейную регрессию с Time как функцией от humidity и Celsius для контроля и обработки по отдельности, а затем сравнить наклоны обеих моделей для каждого участка. Естественно, если вы получаете более высокий наклон при обработке, чем при контроле, это указывает на отзывчивый результат при обработке — чем выше перепад между наклонами, тем лучше реакция на лечение. Модель будет выглядеть примерно так (для одного сайта):

 lm(Time~Celsius Humidity, data = ControlData)
lm(Time~Celsius Humidity, data = TreatmentData)
  

Затем вы можете начать играть с коэффициентами и получать результаты из различий и общего наклона линии регрессии для каждого сайта. И после этого вы даже можете объединить результаты, усреднив коэффициенты 5 контрольных регрессий и сравнив их со средним значением 5 регрессий обработки (поскольку модель линейна, это должно быть статистически достоверно).

Комментарии:

1. Спасибо за ваш вклад. Я обязательно попробую!