#driverless-ai
#беспилотный-ai
Вопрос:
Мы тестируем возможности беспилотного ИИ. Один из наших первых наборов данных похож на этот. X1,X2…. X400, Y1, Y2…Y200
Здесь мы хотим выполнить классификацию с несколькими метками в нашем наборе данных. Однако в веб-клиенте беспилотного AI есть возможность указать только одну цель.
Другой альтернативой, которую я попробовал, было объединение всех переменных Y в один список.
Однако вместо прогнозирования каждой переменной Y, h20.ai просто обрабатывает каждую последовательность чисел как класс.
Как если бы было 3 Y переменных.
затем [0 0 1] и [0 1 0] и так далее до 8 классов.
Затем во время обучения он просто жалуется, что некоторым из этих 8 классов не хватает строк, и удаляет их. В моем случае у меня более 200 переменных Y, поэтому многие из этих классов удаляются.
Как это сделать в беспилотном ИИ?
Комментарии:
1. Я нацелен на аналогичную проблему. Интересно, какой стратегии вы придерживались в этом случае.
Ответ №1:
Беспилотный ИИ на данный момент не поддерживает мультиметрирование. Одним из вариантов было бы создать модель для каждого класса (что в любом случае делает многоклассовое моделирование). 200 Y переменных / классов — это много, поэтому вы можете использовать клиент Python для автоматизации, но для их запуска и оценки потребуется некоторое время. Возможно, попробуйте это для 5 лучших классов и посмотрите, как они работают. Может быть полезно рассмотреть вопрос о сокращении 200 классов в группы, чтобы упростить его.
Комментарии:
1. Есть ли какие-либо обновления о том, когда H2O может поддерживать этот тип проблемы?