Какова целевая метрика по умолчанию, которую модели H2O используют для своего метода прогнозирования ()? Может измениться?

#h2o #h2o.ai

Вопрос:

Я использую H2ORandomForestEsimator. Какова целевая метрика по умолчанию, которую модели H2O используют для своего predict() метода? https://docs.h2o.ai/h2o/latest-stable/h2o-py/docs/modeling.html#h2o.automl.h2oавтоматически.предсказать

Есть ли способ установить это? (Например. чтобы использовать один из других пороговых значений максимизации метрики, которые можно увидеть при просмотре результатов get_params() метода)

В настоящее время я занимаюсь чем-то подобным…

 df_preds = mymodel.predict(df)
activation_threshold = mymodel.find_threshold_by_max_metric('f1', valid=True)
# adjust the predicted label for the desired metric's maximizing threshold
df_preds['predict'] = df_preds['my_positive_class'].apply(lambda probability: 'my_positive_class' if probability >= activation_threshold else 'my_negative_class')
 

видеть

Ответ №1:

При создании прогнозов нет понятия «целевой метрики», поскольку вы просто прогнозируете ответ для строки данных (здесь нет оценки).

Редактировать: Спасибо за разъяснение вашего вопроса. Если вы хотите изменить способ генерации порогового значения, то то, что вы делаете выше, является хорошим решением. Если у вас есть предложение по полезной функции, которая сделала бы это более простым, пожалуйста, отправьте JIRA с вашей идеей (ее определенно можно улучшить).

Комментарии:

1. Я вижу, ты говоришь, что я должен сделать что-то вроде обновленного вопроса, правильный (поскольку я вижу из документации, что модели используют все, что stopping_metric имеет значение документы.Н2О.АИ/Н2О/последней-stable/Н2О-документов/данных/алгоритм-параметры/… )? Кстати, должен ли я использовать > или >= (не мог понять из документов)?