#stata
#stata
Вопрос:
У меня есть следующие данные, которые были подготовлены с stset
. Результирующие переменные обозначают время входа и выхода группы вместе со статусом события. Кроме того, на основе размера набора рисков была рассчитана числовая переменная — prob
.
Для тех объектов, которые не являются случаями (где _d == 0), мне нужно суммировать все значения prob
переменной, где _t
находится время отслеживания этого объекта.
Например, субъект 8 входит в когорту в _t0 == 0 и выходит в _t == 8. Между этими временами есть три prob
значения 0.9, 0.875 и 0.875, что дает желаемый ответ для субъекта 8 как 2.65.
* Example generated by -dataex-. To install: ssc install dataex
clear
input long id byte(_t0 _t _d) float prob
1 0 1 0 .
2 0 2 0 .
3 1 3 1 .9
4 0 4 0 .
5 0 5 1 .875
6 0 6 1 .875
7 5 7 0 .
8 0 8 0 .
9 0 9 1 .8333333
10 0 10 1 .8
11 0 11 0 .
12 8 12 1 .6666667
13 0 13 0 .
14 0 14 0 .
15 0 15 0 .
end
Желаемый результат вернул бы все данные с дополнительной переменной, обозначающей суммированные значения prob
.
Заранее большое спасибо.
Комментарии:
1. Спасибо, что поделились данными. Не могли бы вы добавить определение каждой переменной и уточнить, что вы хотите суммировать? В частности, вы пытаетесь создать одну переменную для каждого объекта?
2. @ArthurMorris — спасибо за помощь. У каждого субъекта есть значения _t0 и _t, определяющие начало и конец их времени наблюдения. Я хотел бы суммировать все значения prob в течение этого времени наблюдения. Только субъекты, у которых _d == 1, имеют вероятное значение. Значения вероятности во время _t — например, prob == 0.9 генерируется во время == 3. Я думаю, что для каждого субъекта мне нужно было бы отфильтровать все значения вероятности по _t0 и _t этого субъекта — что я не знаю, как сделать.
3. Существует ли переменная идентификатора субъекта? В целом кажется, что в данных примера нет всех переменных, которые нам нужны для выполнения задачи.