#python #pandas
Вопрос:
У меня есть один набор данных, который мне нужен, чтобы найти некоторые определенные ключевые слова из столбца обзора, и он должен вернуть весь обзор из него.
Например, предложение выглядит так: очень хороший товар доставлен.
Ключевое слово, которое мне нужно найти, — nice, а также мне нужно вернуть все предложение, содержащее nice, после этого мне нужно удалить возвращенное предложение из набора данных:
x = data.loc[data['Aspect'].str.match("product quality") amp; (data['Sentence'].str.contains("nice|good|great|best"))] data.drop([x],inplace=True)
Как это делается на пандах?
Ответ №1:
Для этого вы можете использовать регулярное выражение.
pattern_to_remove = "(nice)|(good)|(great)|(best)" row_filter = data['Sentence'].str.contains(patternDel) # a filter to determine if the row matches the pattern data = data[~row_filter] # drop the rows