Приводит ли использование paramGrid с TrainValidationSplit к тому, что каждый раз запускается весь конвейер или только тот шаг, который необходимо оптимизировать?
#python #pyspark #databricks #azure-databricks Вопрос: Я использую PySpark в базах данных Azure. У меня есть конвейер со строковыми индексаторами, онехотенкодерами, сборщиком векторов и LinearSVC: pipeline = Pipeline(stages=["stringvar1_indexer", "stringvar2_indexer", "stringvar2_encoder", "assembler",…