#h2o #h2o.ai
Вопрос:
Я использую H2ORandomForestEsimator. Какова целевая метрика по умолчанию, которую модели H2O используют для своего predict()
метода? https://docs.h2o.ai/h2o/latest-stable/h2o-py/docs/modeling.html#h2o.automl.h2oавтоматически.предсказать
Есть ли способ установить это? (Например. чтобы использовать один из других пороговых значений максимизации метрики, которые можно увидеть при просмотре результатов get_params()
метода)
В настоящее время я занимаюсь чем-то подобным…
df_preds = mymodel.predict(df)
activation_threshold = mymodel.find_threshold_by_max_metric('f1', valid=True)
# adjust the predicted label for the desired metric's maximizing threshold
df_preds['predict'] = df_preds['my_positive_class'].apply(lambda probability: 'my_positive_class' if probability >= activation_threshold else 'my_negative_class')
видеть
Ответ №1:
При создании прогнозов нет понятия «целевой метрики», поскольку вы просто прогнозируете ответ для строки данных (здесь нет оценки).
Редактировать: Спасибо за разъяснение вашего вопроса. Если вы хотите изменить способ генерации порогового значения, то то, что вы делаете выше, является хорошим решением. Если у вас есть предложение по полезной функции, которая сделала бы это более простым, пожалуйста, отправьте JIRA с вашей идеей (ее определенно можно улучшить).
Комментарии:
1. Я вижу, ты говоришь, что я должен сделать что-то вроде обновленного вопроса, правильный (поскольку я вижу из документации, что модели используют все, что
stopping_metric
имеет значение документы.Н2О.АИ/Н2О/последней-stable/Н2О-документов/данных/алгоритм-параметры/… )? Кстати, должен ли я использовать>
или>=
(не мог понять из документов)?