#statistics #machine-learning #regression
#Статистика #машинное обучение #регрессия
Вопрос:
У меня есть набор примеров, каждый из которых снабжен комментариями к функциональным данным. Примеры и функции описывают настройки эксперимента в произвольной области (например, количество переключений, количество проведенных дней, количество участников и т.д.). Некоторые функции фиксированы (т. Е. статичны), в то время как другие я могу установить вручную (т. Е. переменные) в будущих экспериментах. Каждый пример также имеет функцию «вознаграждения», которая представляет собой непрерывное число, ограниченное от 0 до 1, указывающее на успех эксперимента, определенный экспертом.
Основываясь на этом наборе примеров и учитывая набор статических функций для будущего эксперимента, как мне определить оптимальное значение для конкретной переменной, чтобы максимизировать вознаграждение?
Кроме того, есть ли у этого процесса официальное название? Я провел некоторое исследование, и это звучит похоже на регрессионный анализ, но я все еще не уверен, что это одно и то же.
Ответ №1:
Этот процесс называется «планирование экспериментов«. Существуют различные методы, которые можно использовать в зависимости от количества параметров и от того, можете ли вы выполнять вычисления между испытаниями или вам нужно выбирать все свои методы лечения заранее.
- полный факториал — попробуйте каждую комбинацию, метод грубой силы
- дробный факториал — устраните некоторые комбинации в шаблоне и используйте регрессию для заполнения недостающих данных
- Плакетт-Берман, поверхность отклика — более сложные методы, заменяющие статистические усилия экспериментальными
- … и многие другие. Это активная область статистических исследований.
Построив регрессионную модель на основе данных ваших экспериментов, вы можете найти оптимум, применив обычные методы численной оптимизации.