Как удалить «_log» из заголовка столбца моего файла CSV

#python #pandas #csv

#python #pandas #csv

Вопрос:

У меня есть файл CSV с заголовками столбцов: 0,1,2,3,4,5,6,7,8,9,10,11

Я использовал Pandas для чтения файла CSV, но получил следующую ошибку:

 ValueError: DataFrame.dtypes for data must be int, float or bool.
                Did not expect the data types in fields 0,1,2,3,4,5,6,7,8,9,10,11_log
  

Как _log сюда попал? Как я могу его удалить? Я перешел к исходному файлу CSV, но не смог обнаружить такое добавление и, следовательно, не смог удалить его вручную.

Спасибо.

РЕДАКТИРОВАТЬ-1

Вы можете любезно найти CSV-файл, о котором я говорю, здесь.

РЕДАКТИРОВАТЬ-2

Я использую это утверждение для чтения файла CSV»

 data_train = pd.read_csv(input_path   'train.csv', sep=';')
  

РЕДАКТИРОВАТЬ-3

Я изменил на sep=',' выше, но теперь получаю следующее (странно, посмотрите на эти u' s и _log s!):

 ValueError: feature_names mismatch: [u'0', u'1', u'2', u'3', u'4', u'5', u'6', u'7', u'8', u'9', u'10', u'11', u'0_log', u'1_log', u'2_log', u'3_log', u'4_log', u'5_log', u'6_log', u'7_log', u'8_log', u'9_log', u'10_log', u'11_log'] [u'-1.3798', u'2.4132', u'13.8796', u'4.4036', u'2.5675', u'1.3097', u'0.92286', u'-14554.0704', u'10099.9967', u'-15572.1921', u'23.3675', u'1.2285', u'-1.3798_log', u'2.4132_log', u'13.8796_log', u'4.4036_log', u'2.5675_log', u'1.3097_log', u'0.92286_log', u'-14554.0704_log', u'10099.9967_log', u'-15572.1921_log', u'23.3675_log', u'1.2285_log']
expected 1_log, 11_log, 3_log, 9_log, 5_log, 0_log, 10_log, 1, 0, 3, 2, 5, 4, 7, 6, 9, 8, 2_log, 8_log, 6_log, 7_log, 11, 10, 4_log in input data
training data did not have the following fields: 1.3097_log, -1.3798_log, 13.8796_log, 1.2285_log, -15572.1921_log, 2.4132, 0.92286, 10099.9967_log, -15572.1921, -1.3798, 10099.9967, 0.92286_log, 2.5675_log, -14554.0704_log, 1.3097, 23.3675_log, 2.5675, 1.2285, 13.8796, 4.4036, 2.4132_log, -14554.0704, 4.4036_log, 23.3675
  

Комментарии:

1. Может быть, вы можете опубликовать 2-3 первые строки нашего csv здесь?

2. Я могу прочитать это без каких-либо проблем прямо из Интернета — pandas.read_csv('https://www.dropbox.com/s/cw79sgtff1dzev3/train.csv?dl=1') Возможно, у вас ошибка в коде. Или вы работаете с другим файлом, который где-то есть _log .

3. Я не могу получить доступ к dropbox, возможно ли скопировать и вставить первые 5 строк вашего csv-объявления в код, который вы прочитали?

4. sep должно быть ',' не ';'

5. Я могу прочитать файл, которым вы поделились с sep=’,’

Ответ №1:

Я делаю это:

 df = pd.read_csv('https://www.dropbox.com/s/cw79sgtff1dzev3/train.csv?dl=1')
  

введите описание изображения здесь

или

 url = 'https://www.dropbox.com/s/cw79sgtff1dzev3/train.csv?dl=1'
df = pd.read_csv(url, names=[1,2,3,4,5,6,7,8,9,10,11],header=0)