#python #machine-learning #optimization #mathematical-optimization #particle-swarm
#python #машинное обучение #оптимизация #математическая оптимизация #particle-swarm
Вопрос:
Мне нужно найти оптимальную скидку для каждого продукта (например, в A, B, C), чтобы я мог максимизировать общий объем продаж. У меня есть существующие модели случайного леса для каждого продукта, которые отображают скидку и сезон продаж. Как мне объединить эти модели и передать их оптимизатору, чтобы найти оптимальную скидку на продукт?
Причина выбора модели:
- RF: он способен обеспечить лучшую (по сравнению с линейными моделями) связь между предикторами и откликом (sales_uplift_norm).
- PSO: предлагается во многих официальных документах (доступны на researchgate / IEEE), также доступен пакет на python здесь и здесь.
Входные данные: примерные данные, используемые для построения модели на уровне продукта. Просмотрите данные, как показано ниже:
Идея / Шаги, за которыми я следую:
- Построить RF-модель для продуктов
# pre-processed data
products_pre_processed_data = {key:pre_process_data(df, key) for key, df in df_basepack_dict.items()}
# rf models
products_rf_model = {key:rf_fit(df) for key, df in products_pre_processed_data .items()}
- Передайте модель оптимизатору
- Целевая функция: максимизировать sales_uplift_norm (переменная отклика модели RF)
- Ограничение:
- общие расходы (расходы A B C <= 20), расходы = total_units_sold_of_products * discount_percentage * mrp_of_products
- нижняя граница товаров (A, B, C): [0.0, 0.0, 0.0] # нижние границы процента скидки
- верхняя граница товаров (A, B, C): [0.3, 0.4, 0.4] # верхние границы процента скидки
sudo / пример кода # поскольку я не могу найти способ передать product_models в оптимизатор.
from pyswarm import pso
def obj(x):
model1 = products_rf_model.get('A')
model2 = products_rf_model.get('B')
model3 = products_rf_model.get('C')
return -(model1 model2 model3) # -ve sign as to maximize
def con(x):
x1 = x[0]
x2 = x[1]
x3 = x[2]
return np.sum(units_A*x*mrp_A units_B*x*mrp_B units_C* x *spend_C)-20 # spend budget
lb = [0.0, 0.0, 0.0]
ub = [0.3, 0.4, 0.4]
xopt, fopt = pso(obj, lb, ub, f_ieqcons=con)
Уважаемые эксперты SO, прошу вашего совета (пытаюсь найти какое-либо руководство уже пару недель) о том, как использовать оптимизатор PSO (или любой другой оптимизатор, если я не следую правильному) с RF.
Добавление функций, используемых для модели:
def pre_process_data(df,product):
data = df.copy().reset_index()
# print(data)
bp = product
print("----------product: {}----------".format(bp))
# Pre-processing steps
print("pre process df.shape {}".format(df.shape))
#1. Reponse var transformation
response = data.sales_uplift_norm # already transformed
#2. predictor numeric var transformation
numeric_vars = ['discount_percentage'] # may include mrp, depth
df_numeric = data[numeric_vars]
df_norm = df_numeric.apply(lambda x: scale(x), axis = 0) # center and scale
#3. char fields dummification
#select category fields
cat_cols = data.select_dtypes('category').columns
#select string fields
str_to_cat_cols = data.drop(['product'], axis = 1).select_dtypes('object').astype('category').columns
# combine all categorical fields
all_cat_cols = [*cat_cols,*str_to_cat_cols]
# print(all_cat_cols)
#convert cat to dummies
df_dummies = pd.get_dummies(data[all_cat_cols])
#4. combine num and char df together
df_combined = pd.concat([df_dummies.reset_index(drop=True), df_norm.reset_index(drop=True)], axis=1)
df_combined['sales_uplift_norm'] = response
df_processed = df_combined.copy()
print("post process df.shape {}".format(df_processed.shape))
# print("model fields: {}".format(df_processed.columns))
return(df_processed)
def rf_fit(df, random_state = 12):
train_features = df.drop('sales_uplift_norm', axis = 1)
train_labels = df['sales_uplift_norm']
# Random Forest Regressor
rf = RandomForestRegressor(n_estimators = 500,
random_state = random_state,
bootstrap = True,
oob_score=True)
# RF model
rf_fit = rf.fit(train_features, train_labels)
return(rf_fit)
РЕДАКТИРОВАТЬ: обновлен набор данных до упрощенной версии.
Комментарии:
1. Можете ли вы уточнить, какова ваша конечная цель? Поскольку вопрос остается в силе, я не вижу причин для объединения RF с PSO. Для того, чтобы быть значимым, вам нужен какой-то способ получения
sales_uplift_norm
отdiscount_percentage
. Если это неизвестный процесс, вы можете смоделировать его с помощью RF, но зачем вам это нужно для задачи оптимизации? Если вы хотите оптимизировать дляdiscount_percentage
почему вы не можете использовать базовый процесс? В любом случае я не понимаю, как RF поможет вам в этой ситуации.2. Конечная цель @a_guest : мне нужно
find optimal discount for each products
(например, в A, B, C), чтобы я могmaximize sales
( сумма продаж A, B, C ) так, чтобыspend budget
( сумма расходов на продукты; расходы A = количество продаж * скидка ) былоfully utilized
. Причина использования RF: Поскольку у меня есть исторические данные об этих продуктах, я использую их, чтобы найти связь междуdiscount
,season
иsales
, которые RF может захватить лучше, по сравнению с линейными моделями. продолжение в комментариях ниже ….3. Причина использования optimizer: Как только отношение определено в RF, я могу использовать его как объективную забаву, описать ограничения, и оптимизатор должен предоставить мне оптимальные значения скидки для каждого товара. Надеюсь, я смогу дать разъяснения на ваши вопросы .
4. Понятно. Итак, сначала вы сопоставляете RF с историческими данными для отображения
discount -> sales
, а затем вы хотели бы найти скидки, которые максимизируют продажи (для которых вы планируете использовать PSO). Если это правильно, я не вижу, в чем проблема; это кажется довольно простым. Можете ли вы более точно указать, где вы застряли?5. @a_guest да, вы абсолютно правы. Я застрял на части «как передать модель (ы) оптимизатору в качестве целевой функции». Поскольку вы упомянули это как простое , не могли бы вы, пожалуйста , опубликовать решение / работу с образцом набора данных, которым я поделился ( даже если вы ссылаетесь на какой-либо другой оптимизатор для этой цели ). Было бы действительно полезно помочь мне приступить к реальной масштабной реализации.
Ответ №1:
вы можете найти полное решение ниже!
Фундаментальные различия с вашим подходом заключаются в следующем :
- Поскольку модель случайного леса принимает в качестве входных данных
season
функцию, оптимальные скидки должны вычисляться для каждого сезона. - Проверяя документацию pyswarm,
con
функция выдает выходные данные, которые должны соответствоватьcon(x) >= 0.0
. Следовательно, правильное ограничение является20 - sum(...)
, а не наоборот. Кроме того, не были заданы переменныеunits
иmrp
; Я просто принял значение 1, возможно, вы захотите изменить эти значения.
Дополнительные модификации вашего исходного кода включают :
- Предварительная обработка и конвейерные оболочки
sklearn
для упрощения этапов предварительной обработки. - Оптимальные параметры хранятся в выходном
.xlsx
файле. maxiter
Параметру PSO присвоено значение5
для ускорения отладки, возможно, вам захочется установить для него другое значение (default =100
).
Следовательно, код :
import pandas as pd
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import OneHotEncoder, StandardScaler
from sklearn.compose import ColumnTransformer
from sklearn.ensemble import RandomForestRegressor
from sklearn.base import clone
# ====================== RF TRAINING ======================
# Preprocessing
def build_sample(season, discount_percentage):
return pd.DataFrame({
'season': [season],
'discount_percentage': [discount_percentage]
})
columns_to_encode = ["season"]
columns_to_scale = ["discount_percentage"]
encoder = OneHotEncoder()
scaler = StandardScaler()
preproc = ColumnTransformer(
transformers=[
("encoder", Pipeline([("OneHotEncoder", encoder)]), columns_to_encode),
("scaler", Pipeline([("StandardScaler", scaler)]), columns_to_scale)
]
)
# Model
myRFClassifier = RandomForestRegressor(
n_estimators = 500,
random_state = 12,
bootstrap = True,
oob_score = True)
pipeline_list = [
('preproc', preproc),
('clf', myRFClassifier)
]
pipe = Pipeline(pipeline_list)
# Dataset
df_tot = pd.read_excel("so_data.xlsx")
df_dict = {
product: df_tot[df_tot['product'] == product].drop(columns=['product']) for product in pd.unique(df_tot['product'])
}
# Fit
print("Training ...")
pipe_dict = {
product: clone(pipe) for product in df_dict.keys()
}
for product, df in df_dict.items():
X = df.drop(columns=["sales_uplift_norm"])
y = df["sales_uplift_norm"]
pipe_dict[product].fit(X,y)
# ====================== OPTIMIZATION ======================
from pyswarm import pso
# Parameter of PSO
maxiter = 5
n_product = len(pipe_dict.keys())
# Constraints
budget = 20
units = [1, 1, 1]
mrp = [1, 1, 1]
lb = [0.0, 0.0, 0.0]
ub = [0.3, 0.4, 0.4]
# Must always remain >= 0
def con(x):
s = 0
for i in range(n_product):
s = units[i] * mrp[i] * x[i]
return budget - s
print("Optimization ...")
# Save optimal discounts for every product and every season
df_opti = pd.DataFrame(data=None, columns=df_tot.columns)
for season in pd.unique(df_tot['season']):
# Objective function to minimize
def obj(x):
s = 0
for i, product in enumerate(pipe_dict.keys()):
s = pipe_dict[product].predict(build_sample(season, x[i]))
return -s
# PSO
xopt, fopt = pso(obj, lb, ub, f_ieqcons=con, maxiter=maxiter)
print("Season: {}t xopt: {}".format(season, xopt))
# Store result
df_opti = pd.concat([
df_opti,
pd.DataFrame({
'product': list(pipe_dict.keys()),
'season': [season] * n_product,
'discount_percentage': xopt,
'sales_uplift_norm': [
pipe_dict[product].predict(build_sample(season, xopt[i]))[0] for i, product in enumerate(pipe_dict.keys())
]
})
])
# Save result
df_opti = df_opti.reset_index().drop(columns=['index'])
df_opti.to_excel("so_result.xlsx")
print("Summary")
print(df_opti)
Это дает :
Training ...
Optimization ...
Stopping search: maximum iterations reached --> 5
Season: summer xopt: [0.1941521 0.11233673 0.36548761]
Stopping search: maximum iterations reached --> 5
Season: winter xopt: [0.18670604 0.37829516 0.21857777]
Stopping search: maximum iterations reached --> 5
Season: monsoon xopt: [0.14898102 0.39847885 0.18889792]
Summary
product season discount_percentage sales_uplift_norm
0 A summer 0.194152 0.175973
1 B summer 0.112337 0.229735
2 C summer 0.365488 0.374510
3 A winter 0.186706 -0.028205
4 B winter 0.378295 0.266675
5 C winter 0.218578 0.146012
6 A monsoon 0.148981 0.199073
7 B monsoon 0.398479 0.307632
8 C monsoon 0.188898 0.210134
Комментарии:
1. Здравствуйте! На самом деле, если ограничение установлено правильно, решение должно лежать на нем: f (x) = 20 должно соблюдаться в конце. Действительно, увеличение стоимости должно приводить к улучшению результатов продаж в целом (более высоким скидкам).