Алгоритм SARSA для обучения с подкреплением уменьшает значения с течением времени
#julia #reinforcement-learning #джулия #подкрепление-обучение Вопрос: В настоящее время я пытаюсь реализовать алгоритм SARSA, как описано в Саттон, Барто "Обучение с подкреплением, введение" в сеточном мире с ветреным восходящим потоком. (Я…