Гипераметры усиления

#tensorflow #reinforcement-learning

Вопрос:

Я новичок в обучении с подкреплением и разработал алгоритм, используя следующее из tensorflow: https://www.tensorflow.org/agents/tutorials/9_c51_tutorial

хотя, просматривая гипераметры, мне трудно определить, что делает каждый из них, и значения, которые я должен им задать. мой проект довольно сложный, с размером тензора 200*200, и это параметры, которые у меня есть для него:

 num_iterations = 15000  # @param {type:"integer"}

initial_collect_steps = 1000  # @param {type:"integer"}
collect_steps_per_iteration = 25  # @param {type:"integer"}
replay_buffer_capacity = 100000  # @param {type:"integer"}

fc_layer_params = (100,)

batch_size = 32  # @param {type:"integer"}

gamma = 0.99
log_interval = 100  # @param {type:"integer"}

num_atoms = 51  # @param {type:"integer"}
min_q_value = -10  # @param {type:"integer"}
max_q_value = 1  # @param {type:"integer"}
n_step_update = 10  # @param {type:"integer"}

num_eval_episodes = 10  # @param {type:"integer"}
eval_interval = 2500  # @param {type:"integer"}
 

может ли кто-нибудь сказать мне, достаточно ли они хороши и какими они должны быть?
Спасибо!