Могу ли я использовать разные наборы данных для разных моделей машинного обучения в ансамблевом обучении?

#pandas #svm #logistic-regression #ensemble-learning #ensembles

Вопрос:

У меня очень большой набор данных, и я хочу использовать в нем различные объекты. У меня есть 15 функций, и я хочу использовать метод VotingClassfier. В методе классификатора голосования я хочу использовать LinearSVC и логистическую регрессию. Это то, что я намерен сделать:

набор данных = df1 (9 объектов)

cloneddataset = df2 (6 функций)

 clf1 = CalibratedClassifierCV(LinearSVC()).fit(dataset, y1) clf2 = CalibratedClassifierCV(LogisticRegression()).fit(dataset, y1) clf = VotingClassifier(estimators=[("svc", clf1), ("lr", clf2)], weights=[2, 1],voting="soft") clf.fit(cloneddataset, y2) score = clf.score(cloneddataset, y2) print("Score: ", score)  

Это означает, что я хочу использовать набор данных с 9 функциями для первого обучения двух моделей и использовать набор cloneddataset для обучения классификатора голосования.

Пожалуйста, я новичок в python и машинном обучении, и я не знаю, имеет ли это какой-либо смысл. Программа выполнена, но я не знаю логики, лежащей в ее основе. Кроме того, результат, который он дает, такой же, как и результат только логистической регрессии.

Я совершаю здесь какие-нибудь ошибки?

Спасибо