#python-3.x #pandas #dataframe
#python-3.x #панды #фрейм данных
Вопрос:
Существует сопоставленный файл json, который преобразуется в файл csv
appended_data = []
for file in glob.glob('data-part.json'):
dfjson = pd.read_json(file,encoding='utf-8',lines=True,dtype=str,error_bad_lines=False)
appended_data.append(dfjson)
appended_data = pd.concat(appended_data)
appended_data.to_csv("data.csv",index = False)
Однако при открытии файла convert csv он выглядит следующим образом (фрагмент показан ниже)
color gear_type oil_type material date_purchase
[] ['Helical'] ['Synthetic'] ['Composite'] 20201505
[] ['Axle'] ['High Mileage'] ['Asphalt'] 20201505
nan ['Front-Axle'] ['Synthetic'] ['Vulcanised'] 20201505
nan ['Bevel'] ['Conventional'] ['Carbon black'] 20201505
Но вместо этого нужно, чтобы файл csv выглядел так (поскольку в нем необходимо выполнить некоторые поиски)
color gear_type oil_type material date_purchase
nan Helical Synthetic Composite 20201505
nan Axle High Mileage Asphalt 20201505
nan Front-Axle Synthetic Vulcanised 20201505
nan Bevel Conventional Carbon black 20201505
Как перехватить эти ненужные файлы (‘[‘,’]’ и т. Д.) И нормализовать данные
Комментарии:
1. Взгляните на метод Dataframe.replace: pandas.pydata.org/pandas-docs/stable/reference/api /…
2. Пробовал
df.replace(regex={'^['.*': '', '.*']$': '','^[]$':''})
, но никаких изменений в фрейме данных..