Использование регулярного выражения для удаления строк из столбца в pandas с помощью оператора loc

#python #pandas

#python #pandas

Вопрос:

У меня есть большой фрейм данных, из которого я хочу удалить все строки, где слово 'test' появляется в столбце Source ( object тип). Однако это слово может иметь множество разновидностей форм, например:

 'test'
'Test'
'TESTE'
  

Как я могу использовать регистронезависимый с регулярным выражением, чтобы удалить эти строки из моего фрейма данных?
Я пробовал следующее:

 mask = df.iloc[:,'Source'].str.contains('/test/ig', regex = True)
df = df.loc[~mask]
  

Комментарии:

1. .str.contains('test', case = False) , сделало бы его нечувствительным к регистру

Ответ №1:

iloc используется для целочисленного определения местоположения, используйте loc для условного.
И, как сказал @sushanth, вариант использования = False

 mask = df.loc[:,'Source'].str.contains('test', case = False)
df = df.loc[~mask]