#python #pandas #dataframe #alternate
Вопрос:
У меня есть 2 столбца кадров данных, подобных этому:
df1 = pd.DataFrame({'A':['CINO','KONO','ROLO','MANE','TUTU']})
df2 = pd.DataFrame({'B':['NION','PONO','RZCO','MPPE','TQAS']})
Моя идея состоит в том, чтобы объединить кадры данных таким образом, чтобы выходные данные выглядели следующим образом:
C
CC1 CINO <---- belongs to A
CC1 NION <---- belongs to B
CC2 KONO <---- belongs to A
CC2 PONO <---- belongs to B
CC3 ROLO <---- belongs to A
CC3 RZCO <---- belongs to B
CC4 MANE <---- belongs to A
CC4 MPPE <---- belongs to B
CC5 TUTU <---- belongs to A
CC5 TQAS <---- belongs to B
Как вы можете видеть, элементы столбца B
размещаются между строками столбца A
.
Обратите внимание, как строки называются таким образом, чтобы каждая пара строк имела одно и то же имя.
Можете ли вы предложить мне разумный способ достижения этой цели с помощью какой-нибудь встроенной функции Pandas?
Ответ №1:
pd.concat(
[df1, df2], axis=1
).stack().reset_index(1, drop=True).to_frame('C').rename(index='CC{}'.format)
C
CC0 CINO
CC0 NION
CC1 KONO
CC1 PONO
CC2 ROLO
CC2 RZCO
CC3 MANE
CC3 MPPE
CC4 TUTU
CC4 TQAS
Ответ №2:
Вы можете использовать:
df = pd.concat([df1.rename(columns={'A':'C'}),
df2.rename(columns={'B':'C'})], keys=[1,2])
.sort_index(level=[1,0])
.reset_index(level=0, drop=True)
df.index = 'CC' df.index.astype(str)
print (df)
C
CC0 CINO
CC0 NION
CC1 KONO
CC1 PONO
CC2 ROLO
CC2 RZCO
CC3 MANE
CC3 MPPE
CC4 TUTU
CC4 TQAS