Как преобразовать типы для определенных столбцов в h2o dataframe?

#h2o

#h2o

Вопрос:

Есть ли способ преобразовать типы определенных столбцов в фрейме данных h2o? Например, если все столбцы имеют тип int в некотором фрейме данных df, но вы хотели бы использовать один из столбцов C из 1 и 0 в качестве примеров ответов для обучения, есть ли способ сделать что-то вроде df['C'].to_type('enum') ? Не удалось найти ничего подобного в документах.

Ответ №1:

вы можете использовать:

  • .asfactor() для преобразования в enum
  • .asnumeric() для преобразования в числовой
  • .ascharacter() для преобразования в символ

Комментарии:

1. В документах, похоже, не указано, что конкретный столбец может быть преобразован, только весь фрейм. Это правда?

2. да, вы можете преобразовать столбец, пожалуйста, смотрите наши примеры кода в приложении к руководству пользователя, всякий раз, когда есть столбец ответа числового столбца, который необходимо преобразовать в enum, мы применяем .asfactor() к этому одному столбцу. docs.h2o.ai/h2o/latest-stable/h2o-docs/data-science/algo-params /… . надеюсь, это поможет!

3. df['col_name'] = df['col_name'].asfactor() . Аналогично для двух других типов.

Ответ №2:

Лучшее, что я смог сделать на данный момент, это преобразовать фрейм данных h2o обратно во фрейм pandas, затем обратно в h2o, указав новые типы столбцов для желаемых столбцов. Например.

 frame_in_h2o = h2o.H2OFrame(
    frame_in_h2o.as_data_frame(), 
    column_types={
        u'C': u'enum'
    })