Входные данные содержат NaN, бесконечность или значение, слишком большое для dtype(‘float64’), но я вручную изменил значения Nan в своей базе данных на 0

#python #pandas #matplotlib #jupyter-notebook #float64

Вопрос:

У меня возникли проблемы с моей формулой регрессии. в моем наборе данных нет никаких значений Nan, когда я просматривал свою базу данных и заменял пустые ячейки значением 0. У меня такое чувство, что это потому, что я прочитал в 3 разных базах данных? это мой текущий код:

 import seaborn as sns
import pandas as pd
%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np

from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
from sklearn.metrics import mean_squared_error, r2_score
from scipy import stats

covid = pd.read_csv(r'C:UsersISAACDocumentsBusiness AnalyticsCapstone projectcomplete covid database.csv')
covid.head() 

covidEA = pd.read_csv(r'C:UsersISAACDocumentsBusiness AnalyticsCapstone projecteurope north america.csv')
covidEA.head()

covidEU = pd.read_csv(r'C:UsersISAACDocumentsBusiness AnalyticsCapstone projecteurope.csv')
covidEU.head()

feature = ['total_vaccinations']
label = ['new_deaths']

x = covidEU[feature]
y = covidEU[label]

x_train, x_test, y_train, y_test = train_test_split(x,y)

linreg = LinearRegression()
linreg.fit(x_train, y_train),
 

Комментарии:

1. Код, который вы опубликовали, выглядит нормально. Вы пробовали исследовать данные в кадрах данных, которые вы создаете из CSV? Ошибка (основанная на названии вашего поста) может быть вызвана чем-то другим, чем у НэН.

2. @AlexK Я посмотрел на свой набор данных и подумал , что это может быть из — за того, что у меня были некоторые отсутствующие значения, где у одной переменной было значение, а у переменной сравнения-нет, но я использовал excel «перейти к» — «специальный», чтобы заполнить пробелы значением 0, я не уверен, что еще попробовать. спасибо за комментарий

3. Вам нужно проверить содержимое ваших фреймов данных pandas. read_csv() возможно, вы добавили несколько дополнительных строк или изменили значения. Просмотрите документацию по этой read_csv() функции и убедитесь, что вы используете ее правильно.