Как мне вернуть работника обратно в пул работников в Go

#multithreading #go

#многопоточность #Вперед

Вопрос:

Я внедряю пул работников, который может принимать задания из канала. После того, как время ожидания продолжало истекать, я понял, что, когда в рабочей сети fcn возникает паника, даже несмотря на то, что я внедрил механизм восстановления, работник по-прежнему не возвращается в пул снова.

На игровой площадке golang я смог воспроизвести проблему:

Ссылка на рабочий пул

Изменен код для play ground:

 package main

import "fmt"
import "time"
import "log"

func recovery(id int, results chan<- int) {
    if r := recover(); r != nil {
        log.Print("IN RECOVERY FUNC - Failed worker: ",id)  
        results <- 0
    }
}

func worker(id int, jobs <-chan int, results chan<- int) {
    for j := range jobs {
    defer recovery(id, results)
    if id == 1 {
        panic("TEST")
    }
        fmt.Println("worker", id, "started job", j)
        time.Sleep(time.Second)
        fmt.Println("worker", id, "finished job", j)
        results <- j * 2
    }
}

func main() {
    jobs := make(chan int, 100)
    results := make(chan int, 100)
    for w := 1; w <= 3; w   {
        go worker(w, jobs, results)
    }
    for j := 1; j <= 10; j   {
        jobs <- j
    }
    close(jobs)
    for a := 1; a <= 10; a   {
        <-results
    }
}
  

Для тестирования я внедрил панику при использовании worker 1. При запуске функция паникует, как и ожидалось, и переходит в восстановление, как ожидалось (также не передает значение в канал), однако рабочий 1, похоже, никогда не возвращается.

Вывод без паники:

 worker 3 started job 1
worker 1 started job 2
worker 2 started job 3
worker 1 finished job 2
worker 1 started job 4
worker 3 finished job 1
worker 3 started job 5
worker 2 finished job 3
worker 2 started job 6
worker 3 finished job 5
worker 3 started job 7
worker 1 finished job 4
worker 1 started job 8
worker 2 finished job 6
worker 2 started job 9
worker 1 finished job 8
worker 1 started job 10
worker 3 finished job 7
worker 2 finished job 9
worker 1 finished job 10
  

Вывод с помощью panic:

 worker 3 started job 1
2009/11/10 23:00:00 RECOVERY Failed worker: 1
worker 2 started job 3
worker 2 finished job 3
worker 2 started job 4
worker 3 finished job 1
worker 3 started job 5
worker 3 finished job 5
worker 3 started job 6
worker 2 finished job 4
worker 2 started job 7
worker 2 finished job 7
worker 2 started job 8
worker 3 finished job 6
worker 3 started job 9
worker 3 finished job 9
worker 3 started job 10
worker 2 finished job 8
worker 3 finished job 10
  

Как мне вернуть работника 1 обратно в пул после восстановления (или в процессе восстановления)

Комментарии:

1. вы уверены, что он восстановлен правильно? на выходе указано: СБОЙ ВОССТАНОВЛЕНИЯ

2. Это просто мой журнал, отображаемый в коде. Позвольте мне изменить это

3. Вы не «возвращаете» работника в пул, потому что этот шаблон не удаляет их из пула. Они просто потребляют ценности и оперируют ими. Если вы хотите, чтобы ваш worker продолжал «работать», не возвращайте его.

4. @user2883071 другое дело, defer выполняется, когда выполнение завершает функцию. Итак, defer внутри цикла неприятный запах.

5. Вы могли бы передать errors канал в рабочие функции, и если они обнаружат ошибку, отправьте ее по каналу, а затем continue . Или, если вас не волнует ошибка, просто continue пропустите это job .

Ответ №1:

Если вас волнуют ошибки, вы могли бы передать errors канал в рабочие функции, и если они столкнутся с error , отправьте его по каналу, а затем continue . Основной цикл может обработать эти ошибки.

Или, если вас не волнует ошибка, просто continue пропустите это задание.

continue Инструкция в основном останавливает обработку этой итерации цикла и продолжает следующую.