Метод Caret train жалуется при попытке использовать пакет H2o: «Что-то не так; отсутствуют все значения метрики точности»

#r #r-caret #h2o

#r #r-caret #h2o

Вопрос:

Я получаю сообщение об ошибке, когда хочу использовать метод H2o в caret в этом примере:

 library(caret)
library(h2o)

data(HELPrct)
ds = HELPrct
fitControl= trainControl(method="repeatedcv", number = 5)
ds$sub = as.factor(ds$substance)
h2oFit1 <- train(homeless ~ female   i1   sub   sexrisk   mcs   pcs, 
               trControl=fitControl, 
               method = "&bm_h2o", 
               data=ds[complete.cases(ds),])
  

Затем R сообщает мне:

 Somethin& is wron&; all the Accuracy metric values are missin&:
   Accuracy       Kappa    
 Min.   : NA   Min.   : NA
 1st Qu.: NA   1st Qu.: NA
 Median : NA   Median : NA
 Mean   :NaN   Mean   :NaN 
 3rd Qu.: NA   3rd Qu.: NA
 Max.   : NA   Max.   : NA  
 NA's   :9     NA's   :9 
Error: Stoppin&
In addition: Warnin& messa&e:
In nominalTrainWorkflow(x = x, y = y, wts = wei&hts, info = trainInfo,  :
  There were missin& values in resampled performance measures.
  

Кто-нибудь знает, как я могу заставить caret работать с h2o? Другие методы не создают никаких проблем.

Ответ №1:

Если я запущу ваш код и проверю предупреждения:

 warnin&s()
Warnin& messa&es:
1: model fit failed for Fold1.Rep1: max_depth=1, ntrees= 50, learn_rate=0.1, min_rows=10, col_sample_rate=1 Error in h2o.&etConnection() : 
  No active connection to an H2O cluster. Did you run `h2o.init()` ?
  

Так что вам нужно сделать h2o.init() (проверьте веб-страницу для получения более подробной информации):

 library(caret)
library(h2o)

h2o.init()
ds = mosaicData::HELPrct

fitControl= trainControl(method="repeatedcv", number = 5)
ds$sub = as.factor(ds$substance)
h2oFit1 <- train(homeless ~ female   i1   sub   sexrisk   mcs   pcs, 
               trControl=fitControl, 
               method = "&bm_h2o", 
               data=ds[complete.cases(ds),])

h2oFit1
Gradient Boostin& Machines 

117 samples
  6 predictor
  2 classes: 'homeless', 'housed' 

No pre-processin&
Resamplin&: Cross-Validated (5 fold, repeated 1 times) 
Summary of sample sizes: 93, 94, 93, 94, 94 
Resamplin& results across tunin& parameters:

  max_depth  ntrees  Accuracy   Kappa    
  1           50     0.5826087  0.0669072
  1          100     0.6253623  0.1895957
  1          150     0.6420290  0.2188447
  2           50     0.6159420  0.1708235
  2          100     0.6072464  0.1513658
  2          150     0.6329710  0.2035319
  3           50     0.6253623  0.1878658
  3          100     0.6159420  0.1701928
  3          150     0.6420290  0.1761487