Объект ‘PipelineModel’ не имеет атрибута ‘прогнозировать’

#python #pandas #pyspark #ensemble-learning

Вопрос:

В приведенном ниже коде я пытаюсь реализовать классификатор взвешенного голосования с использованием EnsembleVoteClassifier() .

 from mlxtend.classifier import EnsembleVoteClassifier  import copy  eclf = EnsembleVoteClassifier(clfs=[s1, s2], weights=[1,1],refit=False)  

были s1 и s2-модели трубопроводов pyspark . Входные данные-это набор данных изображений. S1-это конвейерная модель устройства и LogisticRegression . S2-это конвейерная модель классификатора и NaiveBayes классификатора.

чтобы соответствовать классификатору, мне нужны функции изображений и надписей. Чтобы получить функции, я использовал функцию трансформатора. И преобразован в объект pandas

 qa = featurizer.transform(train)  pandas_df3=qa.toPandas()  y_pred3 = np.array(pandas_df3['features'])  y_true3 = np.array(pandas_df3['label'])  eclf.fit(y_pred3,y_true3)  

для прогнозирования на тестовом наборе с использованием классификатора голосования eclf мне нужны функции тестовых изображений, чтобы получить функции, которые я использовал в функции трансформатора. И преобразован в объект панды.

 qa1 = featurizer.transform(df1)  pandas_df4=qa1.toPandas()  y_pred4 = np.array(pandas_df4['features'])  

используется функция predict () для прогнозирования на тестовом наборе

 eclf.predict(y_pred4)  

но это дает мне ошибку 'PipelineModel' object has no attribute 'predict'

Также существует ли какая-либо функция классификации голосов, такая как EnsembleVoteclassifier в pyspark, для реализации взвешенного классификатора ансамблей.