Рассчитать среднемесячную доходность в данных.таблица с разным количеством запасов в каждом месяце

#r #date #data.table #finance #portfolio

#r #Дата #данные.таблица #финансы #Портфолио

Вопрос:

Предположим, у меня есть data.table, priceDT, с ежедневными наблюдениями за доходностью нескольких акций, например:

 > priceDT
          Date      Return Share
 1: 2011-01-03  0.04500000   GAI
 2: 2011-01-03 -0.02100000   KDV
 3: 2011-01-04  0.03300000   GAI
 4: 2011-01-04  0.01770000   KDV
 5: 2011-01-05 -0.01742000   GAI
 6: 2011-01-05  0.07900000   KDV
 7: 2011-02-06  0.02400000   GAI
 8: 2011-02-06 -0.02110000   KDV
 9: 2011-02-07 -0.04300000   AFT
10: 2011-02-07  0.01199700   AIP
11: 2011-02-07  0.00551810   ARH
12: 2011-02-07  0.07451101   BIK
13: 2011-02-07 -0.03495597   BLU
14: 2011-02-07 -0.06062462   CGR
15: 2011-02-07 -0.03660000   GAI
16: 2011-02-07 -0.01240000   KDV
  

Я хочу рассчитать среднемесячную доходность всех акций за данный месяц. Итак, в январе 2011 года среднее значение доходности двух акций. Мы знаем, что это только две акции из-за столбца share . Первый шаг — получить среднюю доходность каждой акции за этот месяц. Затем получите среднюю доходность портфеля акций за этот месяц. Таким образом, в январе среднее значение GAI составляет 0,02019333, а среднее значение KDV — 0,02523333. Таким образом, среднее значение за месяц равно: 0.02019333

Такова логика доходности портфеля. Я хочу повторить в data.table для остальных месяцев

Для моих выборочных данных мне нужен такой результат:

 portfolio

Date  avg_return
1: 2011-01  0.02271333
2: 2011-02 -0.008700561
  

Данные:

 priceDT <- fread(text = "Date, Return, Share
                 2011-01-03,0.045,GAI
                 2011-01-03,-0.021,KDV
                 2011-01-04,0.033,GAI
                 2011-01-04,0.0177,KDV
                 2011-01-05,-0.01742,GAI
                 2011-01-05,0.079,KDV
                 2011-02-06,0.024,GAI
                 2011-02-06,-0.0211,KDV
                 2011-02-07,-0.043,AFT
                 2011-02-07,0.011997,AIP
                 2011-02-07,0.0055181,ARH
                 2011-02-07,0.074511006,BIK
                 2011-02-07,-0.034955973,BLU
                 2011-02-07,-0.060624622,CGR
                 2011-02-07,-0.0366,GAI
                 2011-02-07,-0.0124,KDV
                 ")

portfolio <- fread(text = "Date, avg_return
                   2011-01,0.022713333
                   2011-02,-0.01194431
                   ")
  

Комментарии:

1. Имеет ли это смысл the average of GAI is 0.02019333 and the average of KDV is 0.02523333. The average for the month is therefore: 0.02019333 ?

Ответ №1:

 priceDT[, mean(Return), by = .(ym = format(Date, "%Y-%m"), Share)
        ][, mean(V1), by = ym]
#         ym           V1
# 1: 2011-01  0.022713333
# 2: 2011-02 -0.008700561
  

Ответ №2:

Вот другой подход, хотя мои результаты не совпадают с вашими.

Вы можете создать столбец «год-месяц» для группировки результатов. Следуя вашим инструкциям, вы можете рассчитать среднюю долю за каждый месяц (для каждой акции), мы будем называть это ShareMean .

Затем вы можете рассчитать среднее значение этих средних значений по всем акциям за данный месяц, мы будем называть это MonthMean .

Это то, что вы имели в виду?

 library(data.table)

priceDT[, YearMonth := list(substr(Date, 1, 7))]
priceDT[, .(ShareMean = mean(Return)), by = c("YearMonth", "Share")][
        , .(MonthMean = mean(ShareMean)), by = "YearMonth"]
  

Вывод

    YearMonth    MonthMean
1:   2011-01  0.022713333
2:   2011-02 -0.008700561
  

Комментарии:

1. Да, это то, что я хотел. Это следует логике. Мой вывод был неверным. Хотелось бы, чтобы я мог принять оба ответа: (

Ответ №3:

Вы можете напрямую рассчитать доходность за месяц, я бы сделал это так:

 library(tidyverse)
library(lubridate)

priceDT %>%
mutate(month =  month.abb[month(Date)]) %>%
group_by(month) %>%
summarise(avg_return = mean(Return))
  

( month.abb[month(Date)] для сокращения месяца, например, январь, февраль)

или сначала вычислите среднее значение акции за данный месяц:

 priceDT %>%
 mutate(month =  month.abb[month(Date)]) %>%
 group_by(month,Share) %>%
 summarise(avg_return = mean(Return))
  

и затем вы можете рассчитать среднемесячную доходность, как указано выше.

Комментарии:

1. Хороший аккуратный подход, аккуратный.

Ответ №4:

Я не понимаю, как вы делаете шаг, чтобы получить среднемесячную доходность для всех акций …. но, может быть, это поможет вам начать?

 #make dates
priceDT[, Date := as.Date( Date ) ]
# step 1: mean by share by month
priceDT[, .(avg_return = mean( Return, na.rm = TRUE) ), 
        by = .( month = format(Date, "%Y-%m"), Share ) ]
  

но здесь я не вижу логики, чтобы добраться до portfolio предоставленного…