#tensorflow #reinforcement-learning
Вопрос:
Я новичок в обучении с подкреплением и разработал алгоритм, используя следующее из tensorflow: https://www.tensorflow.org/agents/tutorials/9_c51_tutorial
хотя, просматривая гипераметры, мне трудно определить, что делает каждый из них, и значения, которые я должен им задать. мой проект довольно сложный, с размером тензора 200*200, и это параметры, которые у меня есть для него:
num_iterations = 15000 # @param {type:"integer"}
initial_collect_steps = 1000 # @param {type:"integer"}
collect_steps_per_iteration = 25 # @param {type:"integer"}
replay_buffer_capacity = 100000 # @param {type:"integer"}
fc_layer_params = (100,)
batch_size = 32 # @param {type:"integer"}
gamma = 0.99
log_interval = 100 # @param {type:"integer"}
num_atoms = 51 # @param {type:"integer"}
min_q_value = -10 # @param {type:"integer"}
max_q_value = 1 # @param {type:"integer"}
n_step_update = 10 # @param {type:"integer"}
num_eval_episodes = 10 # @param {type:"integer"}
eval_interval = 2500 # @param {type:"integer"}
может ли кто-нибудь сказать мне, достаточно ли они хороши и какими они должны быть?
Спасибо!