#pycaret
#pycaret
Вопрос:
Я обучил свою модель pycaret локально, а затем позже перенес ее на S3. Теперь я хочу запустить метод predict_model() для моих больших производственных наборов данных.
Используя boto3, я копирую файл моей модели из S3 на главный узел моего кластера Spark EMR. Затем я импортирую библиотеку, используя
from pycaret.classification import *
И попробуйте применить мои прогнозы, как показано ниже —
model_path = '/tmp/catboost_model_aug19'
saved_model = load_model(model_path)
Transformation Pipeline and Model Successfully Loaded
new_data = spark.sql("select * from table").toPandas()
df = predict_model(saved_model, data = new_data)
Когда я запускаю predict_model()
ит-ошибки, говоря Pipeline not found
В качестве альтернативы, когда я запускаю тот же код на своем локальном компьютере, он работает нормально. Как мне устранить эту ошибку?
Комментарии:
1. Я также сталкиваюсь с такой же проблемой с Pycaret 2.3.1
Ответ №1:
Какая версия Pycaret использовалась для создания модели? Я столкнулся с аналогичной ошибкой, и оказалось, что маринованная модель была построена на предыдущей версии pycaret, в то время как у меня была последняя версия.
Комментарии:
1. да, для меня это то же самое. Я обучил свою модель в версии 2.0, а последняя версия — 2.1.. В итоге я снова установил 2.0, используя
.whl