#python-3.x #pandas #dataframe
#python-3.x #pandas #фрейм данных
Вопрос:
У меня есть требование преобразовать разделенные запятыми строковые значения столбца фрейма данных pandas в повторяющуюся коллекцию, которая может быть либо списком, либо массивом, чтобы мы могли выполнять итерации и выполнять операции с полученным набором значений.
Вы можете понять это с приведенными ниже примерами данных:
__________________________
index | column1
__________________________
0 | val1, val2, val3
__________________________
1 | val3, val4
__________________________
2 | val5, val6, val7
__________________________
Ответ №1:
если я понимаю, что вы хотите: вы используете split для создания списка в каждой строке, поэтому вы можете повторять каждую строку и каждый список column1.
import pandas as pd
df = pd.DataFrame({'column1':['val1, val2, val3', 'val4, val5, val6', 'val7, val8']})
print(df)
df = df.apply(lambda x: x.column1.split(','),axis=1)
print(df)
вывод:
column1
0 val1, val2, val3
1 val4, val5, val6
2 val7, val8
конечный результат.
0 [val1, val2, val3]
1 [val4, val5, val6]
2 [val7, val8]