вычислить процентное сокращение на основе года

#r #dplyr #percentage

#r #dplyr #процент

Вопрос:

У меня есть этот фрейм данных:

 dat = read.delim(text = "LM, year
  85.20000, 2020
  56.70000, 2021
  49.00000, 2022
  71.00000, 2023
  33.00000, 2024
  96.50000, 2025
  26.30000, 2026
  21.30000, 2027", sep = ",", header = T)
 

Я хочу рассчитать изменение процентного сокращения за определенный год, я написал эту функцию для этого:

 pChange = function( dat , startYear){

  lastYear = max(dat$year)
  
  res = dat %>% arrange(year) %>%  
    mutate(change = (LM[year == lastYear] - LM[year == startYear]) / LM[year == startYear])
  res

}

pChange( dat, startYear = 2022)
 

Тем не менее, я получаю одно и то же значение для каждого года, и я думаю, что есть проблема, но я не знаю, как ее исправить. Есть идеи?

     LM year     change
1 85.2 2020 -0.5653061
2 56.7 2021 -0.5653061
3 49.0 2022 -0.5653061
4 71.0 2023 -0.5653061
5 33.0 2024 -0.5653061
6 96.5 2025 -0.5653061
7 26.3 2026 -0.5653061
8 21.3 2027 -0.5653061
 

Ответ №1:

Если вы хотите рассчитать процентное изменение между startYear и каждый год, я полагаю, вы не хотите включать lastYear .

 pChange = function(dat, startYear){
  
  res = dat %>% 
    arrange(year) %>%  
    mutate(change = (LM - LM[year == startYear]) / LM[year == startYear])
  res
}

pChange(dat, startYear = 2022)

    LM year     change
1 85.2 2020  0.7387755
2 56.7 2021  0.1571429
3 49.0 2022  0.0000000
4 71.0 2023  0.4489796
5 33.0 2024 -0.3265306
6 96.5 2025  0.9693878
7 26.3 2026 -0.4632653
8 21.3 2027 -0.5653061
 

Ответ №2:

Я предлагаю вам сначала рассчитать все процентные изменения по сравнению с предыдущим годом, а затем подмножество, которое вы ищете:

 library(tidyverse)

dat <- tribble(
  ~ LM, ~ year,
  85.20000, 2020,
  56.70000, 2021,
  49.00000, 2022,
  71.00000, 2023,
  33.00000, 2024,
  96.50000, 2025,
  26.30000, 2026,
  21.30000, 2027,
)

pchange <- function(dat, start_year) {
  output <- dat %>%
    mutate(change = (LM - lag(LM, order_by = year)) / LM) %>%
    filter(year == start_year)
  output$change
}

pchange(dat, 2025)
 

Комментарии:

1. lag функция будет весьма полезна в этих ситуациях.