Как создать пространство для действий в тренажерном зале с диапазоном от 0 до 10 с разницей в 0,5 между последовательными действиями?

#reinforcement-learning #openai-gym #openal #markov-decision-process

Вопрос:

Я намерен создать пространство для действий в тренажерном зале с диапазоном от 0 до 10

 I want action space like [0 0.5 1 ..... 10]
 

Комментарии:

1. Самый простой способ сделать это-использовать непрерывное действие и дискретизировать на стороне среды : используйте поле(низкий=0, высокий=10, форма=(1,)), а затем округлите значение действия до ближайшего кратного 0,5. Вы также можете использовать дискретное пространство действий размером len([0 0,5 … 10]), но использование дискретного пространства действий может нанести ущерб обучению, поскольку алгоритм видит, что каждое значение полностью отличается от других (0 не более похоже на 0,5, чем 10 в том, как будет работать алгоритм).

2. Хорошо, спасибо, я попробую это

Ответ №1:

Другой способ-использовать перечисление. Смотреть ниже

 from enum import Enum
class Actions(Enum):
     action1 = 0
     action2 = 1
     action3 = 2

# when you call
action == Actions.action2.value