#pyspark #jupyter-notebook #apache-spark-ml
#пыспарк #юпитер-записная книжка #apache-искра-мл
Вопрос:
У меня есть эта модель дерева решений в pyspark:
Что я хочу сделать, так это построить график точности моей модели, изменив maxDepth
from 1 to 20
:
Что я сделал:
from pyspark.ml.tuning import ParamGridBuilder, CrossValidator dt = DecisionTreeClassifier(labelCol='new_label', featuresCol='features') grid = ParamGridBuilder().addGrid(dt.maxDepth,[1,20]).build() evaluator = BinaryClassificationEvaluator() cv = CrossValidator(estimator=dt, estimatorParamMaps=grid, evaluator=evaluator) model = cv.fit(dfTrain_bi) model_pred = model.transform(dfTest_bi)
Мне сейчас трудно составить план accuracy versus MaxDepth
Кто-нибудь может мне помочь, пожалуйста?