#reinforcement-learning #openai-gym #openal #markov-decision-process
Вопрос:
Я намерен создать пространство для действий в тренажерном зале с диапазоном от 0 до 10
I want action space like [0 0.5 1 ..... 10]
Комментарии:
1. Самый простой способ сделать это-использовать непрерывное действие и дискретизировать на стороне среды : используйте поле(низкий=0, высокий=10, форма=(1,)), а затем округлите значение действия до ближайшего кратного 0,5. Вы также можете использовать дискретное пространство действий размером len([0 0,5 … 10]), но использование дискретного пространства действий может нанести ущерб обучению, поскольку алгоритм видит, что каждое значение полностью отличается от других (0 не более похоже на 0,5, чем 10 в том, как будет работать алгоритм).
2. Хорошо, спасибо, я попробую это
Ответ №1:
Другой способ-использовать перечисление. Смотреть ниже
from enum import Enum
class Actions(Enum):
action1 = 0
action2 = 1
action3 = 2
# when you call
action == Actions.action2.value