#python #python-3.x #pandas #csv
Вопрос:
Я пытаюсь загрузить CSV-файл в Python.
import pandas as pd
import sqlite3
from pandas.io import sql
BANK_FULL = pd.read_csv('../csv/bank-full.csv', encoding = 'utf-8')
print(BANK_FULL.columns)
Выход:
Index(['age;"job";"marital";"education";"default";"balance";"housing";"loan";"contact";"day";"month";"duration";"campaign";"pdays";"previous";"poutcome";"y"'], dtype='object')
В итоге все отображается в 1 столбце. Я знаю, что сейчас они в двойных кавычках, поэтому показаны в 1 столбце. Как я могу изменить двойную кавычку на обычную кавычку, чтобы мои столбцы отображались красиво?
Пример текста из CSV-файла:
возраст работа семейное положение образование баланс по умолчанию жилищный кредит контактный день продолжительность месяца кампания пдней предыдущий прием у
58 руководство женат высшее нет 2143 да нет неизвестно 5 мая 261 1 -1 0 неизвестно нет
44 техник один вторичный нет 29 да нет неизвестно 5 мая 151 1 -1 0 неизвестно нет
33 предприниматель женат среднее образование нет 2 да да неизвестно 5 мая 76 1 -1 0 неизвестно нет
Комментарии:
1. Вы забыли показать код, который вы разработали?
2. Как вы прочитали файл? Опубликуйте рабочий пример, включающий несколько строк CSV. Мы хотим знать, есть ли у него заголовок и что он использует в качестве разделителей столбцов. Прямо сейчас вы не показали нам ни код, ни данные… как нам догадаться?
3. Я очень новичок на этом форуме,я учусь размещать его здесь. также очень новичок в python. извините, позвольте мне выяснить, как разместить это здесь
4. Поставьте это в вопрос. Затем используйте
{}
кнопку, чтобы превратить его в кодовый блок. Это значительно облегчает чтение.5. большое вам спасибо за руководство @tdelaney обновил вопрос
Ответ №1:
Вам нужно определить разделитель в виде точки с запятой. Ваш код должен быть таким:
import pandas as pd
BANK_FULL = pd.read_csv('../csv/bank-full.csv', encoding='utf-8', delimiter=";")
print(BANK_FULL.columns)
что приводит к:
Index(['age', 'job', 'marital', 'education', 'default', 'balance', 'housing',
'loan', 'contact', 'day', 'month', 'duration', 'campaign', 'pdays',
'previous', 'poutcome', 'y'],
dtype='object')