Показатель успеха не увеличивается с базовыми показателями

#openai-gym

Вопрос:

Я пытаюсь обучить среду HandReach с ЕЕ базовыми показателями.

Вот так:

 xvfb-run -a python3 -m baselines.run --alg=her --env=HandReach-v0 --num_timesteps=15000
 

Тем не менее, мой показатель успеха как для теста, так и для тренировки остается 0. Есть какие-нибудь предложения?