#python #pandas #dataset #numeric #sklearn-pandas
#python #pandas #набор данных #числовые #sklearn-pandas
Вопрос:
Я пытаюсь прочитать набор данных с помощью python проблема в том, что он не распознает все столбцы как числа, я выбрал только тип данных ‘int16’, ‘int32’, ‘int64’, ‘float16’, ‘float32’, и он выбирает часть данных
data = pd.read_excel(r'C:UsersUserDesktopthesisresult15 staticdataset.xls')
data.shape
1125×307
numerics = ['int16', 'int32', 'int64', 'float16', 'float32']
numerical_vars = list(data.select_dtypes(include=numerics).columns)
data = data[numerical_vars]
print (data)
1125×50
когда я запускаю код без выбора числового значения, я получаю эту ошибку, и когда я добавляю float64 к числовому значению
raise ValueError("Internal work array size computation failed: "
ValueError: Internal work array size computation failed: -10
warnings.warn("Estimator fit failed. The score on this train-test"
Комментарии:
1. Некоторые числовые столбцы могли быть прочитаны как строки, вы можете проверить их с
data.dtypes
помощью . После этого вам нужно сначала преобразовать их, прежде чем использоватьselect_dtypes
2. @Erfan Я обнаружил, что проблема с float64, когда я включаю его, выдает ошибку Я попытался округлить данные до 4 десятичных знаков, но это не сработало, что мне делать?