#pandas #train-test-split
#pandas #train-test-split
Вопрос:
Вот что я продолжаю получать, и я не могу понять, почему. Я скорректировал параметры, но безрезультатно.
tst=[list of features]
X=[tst]
y=[pd.get_dummies(tst['class'],drop_first=True)]
X_train,X_test,y_train,y_test=train_test_split(X,y,train_size=.75)
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-148-63b61d820602> in <module>
----> 1 X_train,X_test,y_train,y_test=train_test_split(X,y,train_size=.75)
~anaconda3libsite-packagessklearnmodel_selection_split.py in train_test_split(*arrays, **options)
2129 n_samples = _num_samples(arrays[0])
2130 n_train, n_test = _validate_shuffle_split(n_samples, test_size, train_size,
-> 2131 default_test_size=0.25)
2132
2133 if shuffle is False:
~anaconda3libsite-packagessklearnmodel_selection_split.py in _validate_shuffle_split(n_samples, test_size, train_size, default_test_size)
1812 'resulting train set will be empty. Adjust any of the '
1813 'aforementioned parameters.'.format(n_samples, test_size,
-> 1814 train_size)
1815 )
1816
ValueError: With n_samples=1, test_size=None and train_size=0.75, the resulting train set will be empty. Adjust any of the aforementioned parameters.
Спасибо.
Комментарии:
1. что это
tst
?2. Это переменная, которая представляет собой список функций.
3. это одна из проблем,
X
должен быть массив numpy размеромm x n