Преобразование циклов for в циклы foreach

#r #foreach #doparallel

#r #foreach #параллельный

Вопрос:

Я хочу сделать приведенный ниже код более эффективным, используя пакет foreach . Я пробовал это очень долго, но мне не удается получить тот же результат, что и при использовании циклов for. Я хотел бы использовать вложенный цикл foreach, включающий распараллеливание… И в качестве выходных данных я хотел бы иметь две матрицы с dim [R,b1] Я был бы очень благодарен за некоторые предложения!!

 n  <- c(100, 300, 500)
R  <- 100
b0 <- 110
b1 <- seq(0.01, 0.1, length.out = 100)

## all combinations of n and b1
grid <- expand.grid(n, b1)
names(grid) <- c("n", "b1")

calcPower <- function( R, b0, grid) {
  
  cl <- makeCluster(3)
  registerDoParallel(cl)
  
  ## n and b1 coefficients
  n  <- grid$n
  b1 <- grid$b1
  
  ## ensures reproducibility
  set.seed(2020)
  x      <- runif(n, 18, 80)
  x.dich <- factor( ifelse( x < median( x), 0, 1))
  
  ## enables to store two outputs
  solution <- list()
  
  ## .options.RNG ensures reproducibility
  res <- foreach(i = 1:R, .combine = rbind, .inorder = TRUE, .options.RNG = 666) %dorng% { 
    p.val   <- list()
    p.val.d <- list()
  
    for( j in seq_along(b1)) {
      
      y <- b0   b1[j] * x   rnorm(n, 0, sd = 10)
      
      mod.lm   <- lm( y ~ x)
      mod.lm.d <- lm( y ~ x.dich)
      
      p.val    <- c( p.val,   ifelse( summary(mod.lm)$coef[2,4]   <= 0.05, 1, 0))
      p.val.d  <- c( p.val.d, ifelse( summary(mod.lm.d)$coef[2,4] <= 0.05, 1, 0))
    }
    
    solution[[1]] <- p.val
    solution[[2]] <- p.val.d
    
    return(solution)
    }
  
  dp.val   <- matrix( unlist(res[,1], use.names = FALSE), R, length(b1), byrow = TRUE)
  dp.val.d <- matrix( unlist(res[,2], use.names = FALSE), R, length(b1), byrow = TRUE)
  
  stopCluster(cl)

  df <- data.frame(
    effectS = b1,
    power   = apply( dp.val,   2, function(x){ mean(x) * 100}),
    power.d = apply( dp.val.d, 2, function(x){ mean(x) * 100}),
    n = factor(n))
  
  return(df)
}

## simulation for different n
tmp <- with(grid,
            by( grid, n,
               calcPower, R = R, b0 = b0))

## combines the 3 results
df.power  <- rbind(tmp[[1]], tmp[[2]], tmp[[3]])

 

Ответ №1:

Я создал foreach цикл в следующем коде. Необходимо было внести некоторые изменения. Намного проще вернуть список, чем матрицу foreach , поскольку он объединен с rbind . Особенно, когда вы хотите вернуть несколько циклов. Мое решение здесь состоит в том, чтобы сохранить все в списке, а затем преобразовать его в матрицу длиной 100.

Примечание: в вашем коде есть одна ошибка. summary( mod.lm.d)$coef[2,4] не существует. Я изменил его на [2] . Настройте в соответствии с вашими потребностями

 solution <- list()
df2<-foreach(i = 1:R, .combine = rbind, .inorder=TRUE) %dopar%{
  set.seed(i)
  p.val <- list()
  p.val.d <- list()
  counter <- list()
  for( j in seq_along(b1)){
    
    x      <- sort( runif(n, 18, 80))
    x.dich <- factor( ifelse( x < median(x), 0, 1))
    y      <- b0   b1[j] * x   rnorm( n, 0, sd = 10)
    
    mod.lm   <- lm( y ~ x)
    mod.lm.d <- lm( y ~ x.dich)
    
    p.val    <- c(p.val, ifelse( summary( mod.lm)$coef[2] <= 0.05, 1, 0))
    p.val.d  <- c(p.val.d, ifelse( summary( mod.lm.d)$coef[2] <= 0.05, 1, 0))
    counter <- c(counter, j)
  }
  solution[[1]] <- p.val
  solution[[2]] <- p.val.d
  solution[[3]] <- counter
  return(solution)
}

dp.val <- unlist(df2[,1], use.names = FALSE)
dp.val.d <-  unlist(df2[,2], use.names = FALSE)

dp.val.matr <- matrix(dp.val, R, length(b1))
dp.val.d.matr <- matrix(dp.val.d, R, length(b1))

stopCluster(cl)
 

для вашего комментария:

Foreach работает с обычным циклом for . Минимальный воспроизводимый пример:

 df<-foreach(i = 1:R, .combine = cbind, .inorder=TRUE) %dopar%{
  x <- list()
  for(j in 1:3){
    x <- c(x,j)
  }
  return(x)
}
 

Комментарии:

1. Теперь я понял, что это совсем не то, что я предполагал. Невозможно использовать обычный цикл for в цикле foreach. j всегда равно 1 и не повторяется через 1:length(b1). Просто чтобы вы знали. И еще раз извините за жалобы!

2. @Andrea a foreach действительно работает с for циклом. Я вставил один пример в ответ. Кроме того, я собираюсь проверить свое решение раньше, не совсем уверенный, что что-то пошло не так. Возможно, я допустил ошибку при объединении данных.

3. @Andrea Я думаю, что допустил ошибку в обработке ваших переменных. Я изменил код на более экономичный способ решения вашей проблемы. Также я вставил вам переменную счетчика, с помощью которой вы можете вызвать ее df2[,3] . Вы можете видеть j , что выполняется итерация. Но я рекомендую его удалить. Это просто ненужная потеря времени.