#python #pandas
#python #pandas
Вопрос:
Я пытаюсь объединить два pandas
фрейма данных с общим именем столбца (orderid). Результирующий фрейм данных (объединенный фрейм данных) удаляет orderid из 2-го фрейма данных. Согласно документации, столбец «включено» должен быть сохранен, если вы явно не укажете этого не делать.
import pandas as pd
df = pd.DataFrame([[1,'a'], [2, 'b'], [3, 'c']], columns=['orderid', 'ordervalue'])
df['orderid'] = df['orderid'].astype(str)
df2 = pd.DataFrame([[1,200], [2, 300], [3, 400], [4,500]], columns=['orderid', 'ordervalue'])
df2['orderid'] = df2['orderid'].astype(str)
pd.merge(df, df2, on='orderid', how='outer', copy=True, suffixes=('_left', '_right'))
Который выводит это:
| |orderid | ordervalue_left | ordervalue_right |
|------|--------|-----------------|------------------|
| 0 | 1 | a | 200 |
| 1 | 2 | b | 300 |
| 2 | 3 | c | 400 |
| 3 | 4 | | 500 |
То, что я пытаюсь создать, это:
| | orderid_left | ordervalue_left | orderid_left | ordervalue_right |
|------|--------------|-----------------|--------------|------------------|
| 0 | 1 | a | 1 | 200 |
| 1 | 2 | b | 2 | 300 |
| 2 | 3 | c | 3 | 400 |
| 3 | NaN | NaN | 4 | 500 |
Как я должен это написать?
Ответ №1:
Переименуйте orderid
столбцы так , чтобы df
у них был столбец с именем orderid_left
и df2
был столбец с именем orderid_right
:
import pandas as pd
df = pd.DataFrame([[1,'a'], [2, 'b'], [3, 'c']], columns=['orderid', 'ordervalue'])
df['orderid'] = df['orderid'].astype(str)
df2 = pd.DataFrame([[1,200], [2, 300], [3, 400], [4,500]], columns=['orderid', 'ordervalue'])
df2['orderid'] = df2['orderid'].astype(str)
df = df.rename(columns={'orderid':'orderid_left'})
df2 = df2.rename(columns={'orderid':'orderid_right'})
result = pd.merge(df, df2, left_on='orderid_left', right_on='orderid_right',
how='outer', suffixes=('_left', '_right'))
print(result)
дает
orderid_left ordervalue_left orderid_right ordervalue_right
0 1 a 1 200
1 2 b 2 300
2 3 c 3 400
3 NaN NaN 4 500
Комментарии:
1. Спасибо! Невероятно раздражает, что pandas требует этого уродливого обходного пути.