Как построить гибридную модель RF (случайный лес) и PSO (оптимизатор роя частиц), чтобы найти оптимальную скидку на товары?

#python #machine-learning #optimization #mathematical-optimization #particle-swarm

#python #машинное обучение #оптимизация #математическая оптимизация #particle-swarm

Вопрос:

Мне нужно найти оптимальную скидку для каждого продукта (например, в A, B, C), чтобы я мог максимизировать общий объем продаж. У меня есть существующие модели случайного леса для каждого продукта, которые отображают скидку и сезон продаж. Как мне объединить эти модели и передать их оптимизатору, чтобы найти оптимальную скидку на продукт?

Причина выбора модели:

  1. RF: он способен обеспечить лучшую (по сравнению с линейными моделями) связь между предикторами и откликом (sales_uplift_norm).
  2. PSO: предлагается во многих официальных документах (доступны на researchgate / IEEE), также доступен пакет на python здесь и здесь.

Входные данные: примерные данные, используемые для построения модели на уровне продукта. Просмотрите данные, как показано ниже: введите описание изображения здесь

Идея / Шаги, за которыми я следую:

  1. Построить RF-модель для продуктов
     # pre-processed data
    products_pre_processed_data = {key:pre_process_data(df, key) for key, df in df_basepack_dict.items()}
    # rf models
    products_rf_model = {key:rf_fit(df) for key, df in products_pre_processed_data .items()}
  
  • Передайте модель оптимизатору
    • Целевая функция: максимизировать sales_uplift_norm (переменная отклика модели RF)
    • Ограничение:
      • общие расходы (расходы A B C <= 20), расходы = total_units_sold_of_products * discount_percentage * mrp_of_products
      • нижняя граница товаров (A, B, C): [0.0, 0.0, 0.0] # нижние границы процента скидки
      • верхняя граница товаров (A, B, C): [0.3, 0.4, 0.4] # верхние границы процента скидки

sudo / пример кода # поскольку я не могу найти способ передать product_models в оптимизатор.

 from pyswarm import pso
def obj(x):
    model1 = products_rf_model.get('A')
    model2 = products_rf_model.get('B')
    model3 = products_rf_model.get('C')
    return -(model1   model2   model3) # -ve sign as to maximize

def con(x):
    x1 = x[0]
    x2 = x[1]
    x3 = x[2]
    return np.sum(units_A*x*mrp_A   units_B*x*mrp_B   units_C* x *spend_C)-20 # spend budget

lb = [0.0, 0.0, 0.0]
ub = [0.3, 0.4, 0.4]

xopt, fopt = pso(obj, lb, ub, f_ieqcons=con)
  

Уважаемые эксперты SO, прошу вашего совета (пытаюсь найти какое-либо руководство уже пару недель) о том, как использовать оптимизатор PSO (или любой другой оптимизатор, если я не следую правильному) с RF.

Добавление функций, используемых для модели:

 def pre_process_data(df,product):
    data = df.copy().reset_index()
#     print(data)
    bp = product
    print("----------product: {}----------".format(bp))
    # Pre-processing steps
    print("pre process df.shape {}".format(df.shape))
        #1. Reponse var transformation
    response = data.sales_uplift_norm # already transformed

        #2. predictor numeric var transformation 
    numeric_vars = ['discount_percentage'] # may include mrp, depth
    df_numeric = data[numeric_vars]
    df_norm = df_numeric.apply(lambda x: scale(x), axis = 0) # center and scale

        #3. char fields dummification
    #select category fields
    cat_cols = data.select_dtypes('category').columns
    #select string fields
    str_to_cat_cols = data.drop(['product'], axis = 1).select_dtypes('object').astype('category').columns
    # combine all categorical fields
    all_cat_cols = [*cat_cols,*str_to_cat_cols]
#     print(all_cat_cols)

    #convert cat to dummies
    df_dummies = pd.get_dummies(data[all_cat_cols])

        #4. combine num and char df together
    df_combined = pd.concat([df_dummies.reset_index(drop=True), df_norm.reset_index(drop=True)], axis=1)
    
    df_combined['sales_uplift_norm'] = response
    df_processed = df_combined.copy()
    print("post process df.shape {}".format(df_processed.shape))
#     print("model fields: {}".format(df_processed.columns))
    return(df_processed)


def rf_fit(df, random_state = 12):
    
    train_features = df.drop('sales_uplift_norm', axis = 1)
    train_labels = df['sales_uplift_norm']
    
    # Random Forest Regressor
    rf = RandomForestRegressor(n_estimators = 500,
                               random_state = random_state,
                               bootstrap = True,
                               oob_score=True)
    # RF model
    rf_fit = rf.fit(train_features, train_labels)

    return(rf_fit)

  

РЕДАКТИРОВАТЬ: обновлен набор данных до упрощенной версии.

Комментарии:

1. Можете ли вы уточнить, какова ваша конечная цель? Поскольку вопрос остается в силе, я не вижу причин для объединения RF с PSO. Для того, чтобы быть значимым, вам нужен какой-то способ получения sales_uplift_norm от discount_percentage . Если это неизвестный процесс, вы можете смоделировать его с помощью RF, но зачем вам это нужно для задачи оптимизации? Если вы хотите оптимизировать для discount_percentage почему вы не можете использовать базовый процесс? В любом случае я не понимаю, как RF поможет вам в этой ситуации.

2. Конечная цель @a_guest : мне нужно find optimal discount for each products (например, в A, B, C), чтобы я мог maximize sales ( сумма продаж A, B, C ) так, чтобы spend budget ( сумма расходов на продукты; расходы A = количество продаж * скидка ) было fully utilized . Причина использования RF: Поскольку у меня есть исторические данные об этих продуктах, я использую их, чтобы найти связь между discount , season и sales , которые RF может захватить лучше, по сравнению с линейными моделями. продолжение в комментариях ниже ….

3. Причина использования optimizer: Как только отношение определено в RF, я могу использовать его как объективную забаву, описать ограничения, и оптимизатор должен предоставить мне оптимальные значения скидки для каждого товара. Надеюсь, я смогу дать разъяснения на ваши вопросы .

4. Понятно. Итак, сначала вы сопоставляете RF с историческими данными для отображения discount -> sales , а затем вы хотели бы найти скидки, которые максимизируют продажи (для которых вы планируете использовать PSO). Если это правильно, я не вижу, в чем проблема; это кажется довольно простым. Можете ли вы более точно указать, где вы застряли?

5. @a_guest да, вы абсолютно правы. Я застрял на части «как передать модель (ы) оптимизатору в качестве целевой функции». Поскольку вы упомянули это как простое , не могли бы вы, пожалуйста , опубликовать решение / работу с образцом набора данных, которым я поделился ( даже если вы ссылаетесь на какой-либо другой оптимизатор для этой цели ). Было бы действительно полезно помочь мне приступить к реальной масштабной реализации.

Ответ №1:

вы можете найти полное решение ниже!

Фундаментальные различия с вашим подходом заключаются в следующем :

  1. Поскольку модель случайного леса принимает в качестве входных данных season функцию, оптимальные скидки должны вычисляться для каждого сезона.
  2. Проверяя документацию pyswarm, con функция выдает выходные данные, которые должны соответствовать con(x) >= 0.0 . Следовательно, правильное ограничение является 20 - sum(...) , а не наоборот. Кроме того, не были заданы переменные units и mrp ; Я просто принял значение 1, возможно, вы захотите изменить эти значения.

Дополнительные модификации вашего исходного кода включают :

  1. Предварительная обработка и конвейерные оболочки sklearn для упрощения этапов предварительной обработки.
  2. Оптимальные параметры хранятся в выходном .xlsx файле.
  3. maxiter Параметру PSO присвоено значение 5 для ускорения отладки, возможно, вам захочется установить для него другое значение (default = 100 ).

Следовательно, код :

 import pandas as pd 
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import OneHotEncoder, StandardScaler
from sklearn.compose import ColumnTransformer
from sklearn.ensemble import RandomForestRegressor 
from sklearn.base import clone

# ====================== RF TRAINING ======================
# Preprocessing
def build_sample(season, discount_percentage):
    return pd.DataFrame({
        'season': [season],
        'discount_percentage': [discount_percentage]
    })

columns_to_encode = ["season"]
columns_to_scale = ["discount_percentage"]
encoder = OneHotEncoder()
scaler = StandardScaler()
preproc = ColumnTransformer(
    transformers=[
        ("encoder", Pipeline([("OneHotEncoder", encoder)]), columns_to_encode),
        ("scaler", Pipeline([("StandardScaler", scaler)]), columns_to_scale)
    ]
)

# Model
myRFClassifier = RandomForestRegressor(
    n_estimators = 500,
    random_state = 12,
    bootstrap = True,
    oob_score = True)

pipeline_list = [
    ('preproc', preproc),
    ('clf', myRFClassifier)
]

pipe = Pipeline(pipeline_list)

# Dataset
df_tot = pd.read_excel("so_data.xlsx")
df_dict = {
    product: df_tot[df_tot['product'] == product].drop(columns=['product']) for product in pd.unique(df_tot['product'])
}

# Fit
print("Training ...")
pipe_dict = {
    product: clone(pipe) for product in df_dict.keys()
}

for product, df in df_dict.items():
    X = df.drop(columns=["sales_uplift_norm"])
    y = df["sales_uplift_norm"]
    pipe_dict[product].fit(X,y)

# ====================== OPTIMIZATION ====================== 
from pyswarm import pso
# Parameter of PSO
maxiter = 5

n_product = len(pipe_dict.keys())

# Constraints
budget = 20
units  = [1, 1, 1]
mrp    = [1, 1, 1]

lb = [0.0, 0.0, 0.0]
ub = [0.3, 0.4, 0.4]

# Must always remain >= 0
def con(x):
    s = 0
    for i in range(n_product):
        s  = units[i] * mrp[i] * x[i]

    return budget - s

print("Optimization ...")

# Save optimal discounts for every product and every season
df_opti = pd.DataFrame(data=None, columns=df_tot.columns)
for season in pd.unique(df_tot['season']):

    # Objective function to minimize
    def obj(x):
        s = 0
        for i, product in enumerate(pipe_dict.keys()):
            s  = pipe_dict[product].predict(build_sample(season, x[i]))
        
        return -s

    # PSO
    xopt, fopt = pso(obj, lb, ub, f_ieqcons=con, maxiter=maxiter)
    print("Season: {}t xopt: {}".format(season, xopt))

    # Store result
    df_opti = pd.concat([
        df_opti,
        pd.DataFrame({
            'product': list(pipe_dict.keys()),
            'season': [season] * n_product,
            'discount_percentage': xopt,
            'sales_uplift_norm': [
                pipe_dict[product].predict(build_sample(season, xopt[i]))[0] for i, product in enumerate(pipe_dict.keys())
            ]
        })
    ])

# Save result
df_opti = df_opti.reset_index().drop(columns=['index'])
df_opti.to_excel("so_result.xlsx")
print("Summary")
print(df_opti)
  

Это дает :

 Training ...
Optimization ...
Stopping search: maximum iterations reached --> 5
Season: summer   xopt: [0.1941521  0.11233673 0.36548761]
Stopping search: maximum iterations reached --> 5
Season: winter   xopt: [0.18670604 0.37829516 0.21857777]
Stopping search: maximum iterations reached --> 5
Season: monsoon  xopt: [0.14898102 0.39847885 0.18889792]
Summary
  product   season  discount_percentage  sales_uplift_norm
0       A   summer             0.194152           0.175973
1       B   summer             0.112337           0.229735
2       C   summer             0.365488           0.374510
3       A   winter             0.186706          -0.028205
4       B   winter             0.378295           0.266675
5       C   winter             0.218578           0.146012
6       A  monsoon             0.148981           0.199073
7       B  monsoon             0.398479           0.307632
8       C  monsoon             0.188898           0.210134
  

Комментарии:

1. Здравствуйте! На самом деле, если ограничение установлено правильно, решение должно лежать на нем: f (x) = 20 должно соблюдаться в конце. Действительно, увеличение стоимости должно приводить к улучшению результатов продаж в целом (более высоким скидкам).