Обучение XGBoost по сегментам данных

#x&boost

#x&boost

Вопрос:

Я новичок в x&boost и пытаюсь выяснить, есть ли возможность обучить алгоритм по сегментированным данным нескольким вычислительным узлам (т. Е. данные распределяются по разным серверам).

В качестве примера представьте, что dataset.csv разделен на четыре отдельных набора данных, каждый из которых находится на отдельном сервере. Можем ли мы параллельно обучать алгоритм (XGBoost) по каждому набору данных (запущенному на каждой машине), а затем объединять результаты? Это было бы полезно с точки зрения сокращения общего времени выполнения.

Заранее спасибо.

Комментарии:

1. Было бы x&boost.readthedocs.io/en/latest/jvm /… подходит для вашего варианта использования?

2. @jared_mamrot не совсем, я не использую spark.