#pandas #dataframe
#pandas #фрейм данных
Вопрос:
Все в названии : Может ли столбец из фрейма данных python pandas быть списком, или ансамблем, или кортежем, или … ?
import pandas as pd
lnks = [ ( 'a' , 'b') , ( 'b' , 'c') , ( 'c' , 'a' ) , ('b' , 'd' ) , ( 'd' , 'a' ) ]
lbls = [ 'x' , 'y']
df = pd.DataFrame.from_records( lnks , columns = lbls )
Пытаюсь создать новый столбец z типа ensemble из значений строк столбцов x и y :
df[ 'z' ] = { df[ 'x' ] , df[ 'y' ] }
Я получаю следующий код ошибки :
Ошибка типа: объекты ‘Series’ изменяемы, поэтому они не могут быть хэшем
Я хотел бы получить фрейм данных, содержащий :
x y z
'a' 'b' { 'a , 'b' }
'b' 'c' { 'b' , 'c' }
'c' 'a' { 'c' , 'a' }
...
Спасибо за вашу помощь.
Ответ №1:
Это:
lnks = [('a', 'b'), ('b', 'c'), ('c', 'a'), ('b', 'd'), ('d', 'a')]
lbls = ['x', 'y']
df = pd.DataFrame.from_records(lnks, columns=lbls)
df['z'] = df.apply(lambda r: ( r.x, r.y ), axis=1) #if you want a tuple
или
df['z'] = df.apply(lambda r: [r.x, r.y ], axis=1) #if you want a list
print(df)
Комментарии:
1. привет, мне нужен объект set для каждого значения нового столбца z. В любом случае спасибо.
Ответ №2:
Для кортежей используйте apply
with axis=1
для обработки по строкам:
df[ 'z' ] = df.apply(lambda x: (x[ 'x' ] , x[ 'y' ]), axis=1)
print (df)
x y z
0 a b (a, b)
1 b c (b, c)
2 c a (c, a)
3 b d (b, d)
4 d a (d, a)