Получение ошибки «Ошибка значения: найдены входные переменные с несогласованным количеством выборок: [35, 311]» в алгоритме knn ML с python

#python #knn

#python #knn

Вопрос:

Я пытаюсь применить этот код на практике для ML, но я сталкиваюсь с некоторой ошибкой, гласящей «Ошибка значения: найдены входные переменные с несогласованным количеством выборок: [70, 276]»

код следующий:

     X = Feature
    X[0:5]
    y = df['loan_status'].values
    y[0:5]
    X= preprocessing.StandardScaler().fit(X).transform(X)
    X[0:5]
    from sklearn.metrics import jaccard_similarity_score, log_loss, 
    f1_score
    from sklearn.model_selection import train_test_split
    from sklearn.neighbors import KNeighborsClassifier



    #Split data....also face error here
    Xtrn, Xtst, ytrn, ytst = train_test_split(X, y, test_size=0.2, 
    random_state=6)
    #Lets k=6
    k = 6
    knn= KNeighborsClassifier(n_neighbors = k).fit(Xtrn,ytrn)
    knn
    y_pred = knn.predict(Xtrn)
    y_pred[0:5]


    #-----face error here
    print("Jaccard Score in train set= ", jaccard_similarity_score(ytrn, 
    knn.predict(Xtrn)))
    print("F1 Score in train set= ", f1_score(ytrn, knn.predict(Xtrn), 
    average='weighted'))
    print("F1 Score in test set=  ", f1_score(ytst, y_pred, 
    average='weighted'))
    print("Jaccard Score in test set= ", jaccard_similarity_score(ytst, 
    y_pred))
  

Ответ №1:

X и Y не имеют правильной формы для train_test_split . Попробуйте проверить их формы.

Используйте shape метод. Например — X.shape

Затем используйте reshape метод, чтобы выровнять обе формы.

Комментарии:

1. Я выполнил, но результата нет, можете ли вы указать мне, как изменить?

2. Вам придется поделиться выборкой ваших данных.