#openai-gym
Вопрос:
Я пытаюсь обучить среду HandReach с ЕЕ базовыми показателями.
Вот так:
xvfb-run -a python3 -m baselines.run --alg=her --env=HandReach-v0 --num_timesteps=15000
Тем не менее, мой показатель успеха как для теста, так и для тренировки остается 0. Есть какие-нибудь предложения?