Как оценить актеров, обученных в пользовательских средах в rllib (Ray)?

#ray

#ray

Вопрос:

Следуя примеру SimpleCorridor, я могу создать свою собственную среду и обучить модель! неплохо. Но когда я пытаюсь оценить эту обученную модель, rllib не распознает мою пользовательскую среду.

Как я могу оценить обученную модель в пользовательской среде?

Когда я использую rllib rollout ... то, что предлагается здесь, он не распознает мою среду env, потому что она пользовательская. Я надеялся иметь функцию, подобную run_experiments но похожую evaluate_experiment , чтобы я мог вызвать ее в своем проекте внутри одного из моих файлов.

Вот в чем проблема. Если вы хотите увидеть мой custon_env, это один

Прямо сейчас мне приходится копировать свою среду и вставлять ее в gym/envs/ каталог пакета и регистрировать в __init__.py файле.

Было бы неплохо увидеть другой способ сделать это

Спасибо

Ответ №1:

Вы можете скопировать rollout.py скрипт и измените его, чтобы зарегистрировать любые пользовательские среды или модели в начале скрипта. Это позволит ему работать с любыми средами, которых еще нет в gym.