#python #pandas #dataframe
#python #pandas #фрейм данных
Вопрос:
Итак, у меня есть фрейм данных со столбцом как таковым
Product_ID |
---|
1234 |
1234-AA |
1234-BB |
1234 |
И я хочу удалить суффиксы -AA -BB из значений
Product_ID |
---|
1234 |
1234 |
1234 |
1234 |
Я пытался использовать str.replace
и str.contains
, но они, похоже, не работают
Комментарии:
1. вы пробовали использовать Series.str.extract(‘d d d d»)?
2. Как насчет разделения
'-'
и сохранения первой части?df['Product_ID']..str.split('-').str[0]
Ответ №1:
о чем:
df['Product_ID_refined'] = df['Product_ID'].str.extract('(d )')
Ответ №2:
Вы можете попробовать использовать регулярное выражение, а затем преобразовать его обратно в фрейм данных. Ниже приведен некоторый код, который сработал для меня.
data = pd.read_csv("data.csv", header=None)
removeStrings = r'|'.join(-AA,-BB)
text = re.sub(removeStrings, '', str(data))