#r #dplyr #percentage
#r #dplyr #процент
Вопрос:
У меня есть этот фрейм данных:
dat = read.delim(text = "LM, year
85.20000, 2020
56.70000, 2021
49.00000, 2022
71.00000, 2023
33.00000, 2024
96.50000, 2025
26.30000, 2026
21.30000, 2027", sep = ",", header = T)
Я хочу рассчитать изменение процентного сокращения за определенный год, я написал эту функцию для этого:
pChange = function( dat , startYear){
lastYear = max(dat$year)
res = dat %>% arrange(year) %>%
mutate(change = (LM[year == lastYear] - LM[year == startYear]) / LM[year == startYear])
res
}
pChange( dat, startYear = 2022)
Тем не менее, я получаю одно и то же значение для каждого года, и я думаю, что есть проблема, но я не знаю, как ее исправить. Есть идеи?
LM year change
1 85.2 2020 -0.5653061
2 56.7 2021 -0.5653061
3 49.0 2022 -0.5653061
4 71.0 2023 -0.5653061
5 33.0 2024 -0.5653061
6 96.5 2025 -0.5653061
7 26.3 2026 -0.5653061
8 21.3 2027 -0.5653061
Ответ №1:
Если вы хотите рассчитать процентное изменение между startYear
и каждый год, я полагаю, вы не хотите включать lastYear
.
pChange = function(dat, startYear){
res = dat %>%
arrange(year) %>%
mutate(change = (LM - LM[year == startYear]) / LM[year == startYear])
res
}
pChange(dat, startYear = 2022)
LM year change
1 85.2 2020 0.7387755
2 56.7 2021 0.1571429
3 49.0 2022 0.0000000
4 71.0 2023 0.4489796
5 33.0 2024 -0.3265306
6 96.5 2025 0.9693878
7 26.3 2026 -0.4632653
8 21.3 2027 -0.5653061
Ответ №2:
Я предлагаю вам сначала рассчитать все процентные изменения по сравнению с предыдущим годом, а затем подмножество, которое вы ищете:
library(tidyverse)
dat <- tribble(
~ LM, ~ year,
85.20000, 2020,
56.70000, 2021,
49.00000, 2022,
71.00000, 2023,
33.00000, 2024,
96.50000, 2025,
26.30000, 2026,
21.30000, 2027,
)
pchange <- function(dat, start_year) {
output <- dat %>%
mutate(change = (LM - lag(LM, order_by = year)) / LM) %>%
filter(year == start_year)
output$change
}
pchange(dat, 2025)
Комментарии:
1.
lag
функция будет весьма полезна в этих ситуациях.