#python-3.x #pandas #dataframe
Вопрос:
У меня есть фрейм данных pandas, в котором есть такие столбцы.
Столбцы: [JobID, ввод обучения, время создания, время начала, время окончания, состояние, вывод обучения, etag, сообщение об ошибке, метки].
trainingInput-это словарь, в котором я удаляю часть данных и создаю новый столбец «ServiceAccount» в кадре данных. Я получаю случайные данные в новом столбце.
Образец кадра данных:
trainingInput = {'scaleTier': 'CUSTOM', 'masterType': 'n2-highmem-4', 'packageUris': ['gs:/marketprice_aitp-0.0.0.tar.gz'] 'pythonVersion': '3.7', 'serviceAccount': 'projects/kk1'}
учетная запись службы должна быть — ‘проекты/kk1’ и должна быть вставлена в соответствующий вход обучения.
**Expected output:** trainingInput serviceAccount {'scaleTier': 'CUSTOM', 'masterType': projects/kk1 'n2-highmem-4', 'packageUris': ['gs:/marketprice_aitp-0.0.0.tar.gz'] 'pythonVersion': '3.7', 'serviceAccount': 'projects/kk1'}
Но то, что я получаю, — это случайные данные для ServiceAccount, основанные на приведенном ниже коде.
k_1 = df['trainingInput'].values temp =[] for i in k_1: m= json.dumps(i) k = json.loads(m) temp.append(k['serviceAccount']) try: df5 =pd.DataFrame(temp) # df.merge(pd.DataFrame(data=[df5.values] * len(df), columns=df5.index, #index=df.index), left_index=True, right_index=True) df['serviceaccount'] =k['serviceAccount'] # df['region'] = k['region'] except KeyError: df['serviceaccount'] = 'None'
Я также попробовал слияние, прокомментированное здесь. Но я получаю ошибку «Ошибка значения: буфер имеет неправильное количество измерений (ожидалось 1, получено 2)». Пожалуйста, дайте мне знать ваши мысли. Спасибо.
Комментарии:
1. Было бы наиболее полезно, если бы вы могли показать в качестве образца свои данные и на основе этого образца выходной кадр данных, который вы хотите получить.
2. Я добавил ожидаемые входные и выходные данные к вопросу.