Как изменить значение ячейки в столбце по отношению к другому значению ячейки в другом столбце в r?

#r #weather #monthcalendar

Вопрос:

Я хотел бы заменить значение «месяц» значением «неделя». Если это 52-я неделя, то месяц должен быть 12. Как это сделать с данными?

Примеры данных:

    year month week
    2010 1 52
    2010 12 52
    2011 1 52
    2011 12 52
    2012 1 52
    2012 12 52
 

ожидаемые данные:

 year month week
2010 12 52
2010 12 52
2011 12 52
2011 12 52
2012 12 52
2012 12 52
 

Комментарии:

1. Есть недели, которые содержат дни в двух разных месяцах, не так ли ? Так что ты не можешь делать то, что хочешь.

2. @MrSmithGoesToWashington Это зависит от того, что интересует оператора: они могут захотеть узнать месяц, в котором начинается неделя.

Ответ №1:

Как отметил @MrSmithGoesToWashington, если вы посмотрите с точки зрения времени, это невозможно. Но если вы просто спрашиваете, как изменить любое значение на основе значения в другом столбце, вы можете сделать что-то подобное.

 library(dplyr)
df <- data.frame(year = c(2010, 2010),
                 month = c(1, 12),
                 week = c(52, 52))

df %>% mutate(month = ifelse(week == 52, 12, df$month))
 

Ответ №2:

Вот базовый способ R.
Если год/неделя находятся между годом/неделей первого и последнего дней декабря, то месяц равен 12, иначе это зарегистрированный месяц.

 yw <- with(df1, paste(year, week))
yy01 <- paste(df1$year, 12, 1, sep = "-")
yy31 <- paste(df1$year, 12, 31, sep = "-")
yy01 <- format(as.Date(yy01), "%Y %U")
yy31 <- format(as.Date(yy31), "%Y %U")
ifelse(yy01 <= yw amp; yw <= yy31, 12, df1$month)
#[1] 12 12 12 12 12 12
 

И присвоьте это значение столбцу month .

 df1$month <- ifelse(yy01 <= yw amp; yw <= yy31, 12, df1$month)
 

Данные

 df1 <- read.table(text = "
 year month week
    2010 1 52
    2010 12 52
    2011 1 52
    2011 12 52
    2012 1 52
    2012 12 52
", header = TRUE)
 

Ответ №3:

 # Import data: df1 => data.frame
df1 <- structure(list(year = c(2010L, 2010L, 2011L, 2011L, 2012L, 2012L
), week = c(52L, 52L, 52L, 52L, 52L, 52L)), class = "data.frame", 
row.names = c(NA, -6L))

# Generate a sequence of dates, store as a data.frame: 
# date_range => data.frame
date_range <- data.frame(
  date = seq(
    from = as.Date(
      paste(
        min(df1$year),
        "01-01",
        sep = "-"
      )
    ),
    to = as.Date(
      paste(
        max(df1$year),
        "12-31",
        sep = "-"
      )
    ),
    by = "days"
  )
)

# Derive the month: month_no => integer vector
date_range$month_no <- as.integer(
  strftime(
    date_range$date,
    "%m"
  )
)

# Derive the week: week_no => integer vector
date_range$week_no <- as.integer(
  strftime(
    date_range$date,
    "%V"
  )
)

# Derive the year: year_no => integer vector
date_range$year_no <- as.integer(
  strftime(
    date_range$date,
    "%Y"
  )
)

# Create a lookup table: year_mon_week_lkp => data.frame
year_mon_week_lkp <- transform(
  aggregate(
    month_no ~ year_no week_no,
    data = date_range,
    FUN = max
  ),
  month_no = ifelse(week_no >= 52, 12, month_no)
)

# Resolve the month using the week_no and the year: 
# month => integer vector
df1$month <- with(
  df1, 
  year_mon_week_lkp$month_no[
    match(
      paste0(
        year,
        week
      ),
      paste0(
          year_mon_week_lkp$year_no, 
          year_mon_week_lkp$week_no
      )
    )
  ]
)