Изучение оптимальных параметров для максимизации вознаграждения

#statistics #machine-learning #regression

#Статистика #машинное обучение #регрессия

Вопрос:

У меня есть набор примеров, каждый из которых снабжен комментариями к функциональным данным. Примеры и функции описывают настройки эксперимента в произвольной области (например, количество переключений, количество проведенных дней, количество участников и т.д.). Некоторые функции фиксированы (т. Е. статичны), в то время как другие я могу установить вручную (т. Е. переменные) в будущих экспериментах. Каждый пример также имеет функцию «вознаграждения», которая представляет собой непрерывное число, ограниченное от 0 до 1, указывающее на успех эксперимента, определенный экспертом.

Основываясь на этом наборе примеров и учитывая набор статических функций для будущего эксперимента, как мне определить оптимальное значение для конкретной переменной, чтобы максимизировать вознаграждение?

Кроме того, есть ли у этого процесса официальное название? Я провел некоторое исследование, и это звучит похоже на регрессионный анализ, но я все еще не уверен, что это одно и то же.

Ответ №1:

Этот процесс называется «планирование экспериментов«. Существуют различные методы, которые можно использовать в зависимости от количества параметров и от того, можете ли вы выполнять вычисления между испытаниями или вам нужно выбирать все свои методы лечения заранее.

  • полный факториал — попробуйте каждую комбинацию, метод грубой силы
  • дробный факториал — устраните некоторые комбинации в шаблоне и используйте регрессию для заполнения недостающих данных
  • Плакетт-Берман, поверхность отклика — более сложные методы, заменяющие статистические усилия экспериментальными
  • … и многие другие. Это активная область статистических исследований.

Построив регрессионную модель на основе данных ваших экспериментов, вы можете найти оптимум, применив обычные методы численной оптимизации.