#python #pandas #pyspark #ensemble-learning
Вопрос:
В приведенном ниже коде я пытаюсь реализовать классификатор взвешенного голосования с использованием
EnsembleVoteClassifier()
.
from mlxtend.classifier import EnsembleVoteClassifier import copy eclf = EnsembleVoteClassifier(clfs=[s1, s2], weights=[1,1],refit=False)
были s1 и s2-модели трубопроводов pyspark . Входные данные-это набор данных изображений. S1-это конвейерная модель устройства и
LogisticRegression
. S2-это конвейерная модель классификатора иNaiveBayes
классификатора.чтобы соответствовать классификатору, мне нужны функции изображений и надписей. Чтобы получить функции, я использовал функцию трансформатора. И преобразован в объект pandas
qa = featurizer.transform(train) pandas_df3=qa.toPandas() y_pred3 = np.array(pandas_df3['features']) y_true3 = np.array(pandas_df3['label']) eclf.fit(y_pred3,y_true3)
для прогнозирования на тестовом наборе с использованием классификатора голосования eclf мне нужны функции тестовых изображений, чтобы получить функции, которые я использовал в функции трансформатора. И преобразован в объект панды.
qa1 = featurizer.transform(df1) pandas_df4=qa1.toPandas() y_pred4 = np.array(pandas_df4['features'])
используется функция predict () для прогнозирования на тестовом наборе
eclf.predict(y_pred4)
но это дает мне ошибку
'PipelineModel' object has no attribute 'predict'
Также существует ли какая-либо функция классификации голосов, такая как EnsembleVoteclassifier в pyspark, для реализации взвешенного классификатора ансамблей.