Удаление подстроки значения в фрейме данных в Python

#python #pandas #dataframe

#python #pandas #фрейм данных

Вопрос:

Итак, у меня есть фрейм данных со столбцом как таковым

Product_ID
1234
1234-AA
1234-BB
1234

И я хочу удалить суффиксы -AA -BB из значений

Product_ID
1234
1234
1234
1234

Я пытался использовать str.replace и str.contains , но они, похоже, не работают

Комментарии:

1. вы пробовали использовать Series.str.extract(‘d d d d»)?

2. Как насчет разделения '-' и сохранения первой части? df['Product_ID']..str.split('-').str[0]

Ответ №1:

о чем:

 df['Product_ID_refined'] = df['Product_ID'].str.extract('(d )')
 

Ответ №2:

Вы можете попробовать использовать регулярное выражение, а затем преобразовать его обратно в фрейм данных. Ниже приведен некоторый код, который сработал для меня.

 data = pd.read_csv("data.csv", header=None)
removeStrings = r'|'.join(-AA,-BB)
text = re.sub(removeStrings, '', str(data))