#python #pandas #lambda #data-analysis #data-cleaning
#python #pandas #лямбда #анализ данных #очистка данных
Вопрос:
В настоящее время у меня есть два столбца:
Word Sentence
apple [this, fruit, is, an, apple]
orange [orange, is, this, fruit]
grape [this, is, grape]
strawberry [strawberry, is, nice]
Как бы мне удалить значение, которое появляется в df [‘Word’] из df[‘Sentence’], чтобы результат был:
Word Sentence
apple [this, fruit, is, an]
orange [is, this, fruit]
grape [this, is]
strawberry [is, nice]
В настоящее время я пытаюсь использовать этот цикл while, который не очень похож на pythonic.
count_row = df.shape[0]
i=0
while i < count_row :
mylist = df.iloc[i]["Sentence"]
mykeyword = df.iloc[i]["Word"]
mylist = mylist.split()
for word in mylist:
if word == mykeyword:
df.iloc[i]["Sentence"] = df.iloc[i]["Sentence"].replace(word, '')
print(i)
i=i 1
Однако цикл не удаляет значения. Каков наилучший способ достижения желаемого результата?
Ответ №1:
Как насчет чего-то вроде…
def remove_name(r):
r['Sentence'] = [w for w in r['Sentence'] if w != r['Word']]
return r
df.apply(remove_name,axis=1)
Apply позволяет нам выполнять подобные операции сразу, никаких итераций не требуется.
Ответ №2:
Вы можете использовать функцию удаления, чтобы удалить элемент из списка.
Синтаксис: list.remove(элемент)
Где «список» — это ваш список предложений, а «элемент» — это название вашего фрукта, которое нужно удалить.
Чтобы узнать больше о функции удаления, обратитесь к документам python или по этой ссылке: https://www.programiz.com/python-programming/methods/list/remove