Удалите значения из одного столбца, которые равны значению в другом

#python #pandas #lambda #data-analysis #data-cleaning

#python #pandas #лямбда #анализ данных #очистка данных

Вопрос:

В настоящее время у меня есть два столбца:

 Word          Sentence
apple         [this, fruit, is, an, apple]
orange        [orange, is, this, fruit]
grape         [this, is, grape]
strawberry    [strawberry, is, nice]
 

Как бы мне удалить значение, которое появляется в df [‘Word’] из df[‘Sentence’], чтобы результат был:

 Word          Sentence
apple         [this, fruit, is, an]
orange        [is, this, fruit]
grape         [this, is]
strawberry    [is, nice]
 

В настоящее время я пытаюсь использовать этот цикл while, который не очень похож на pythonic.

 count_row = df.shape[0]

i=0

while i < count_row :

    mylist = df.iloc[i]["Sentence"]

    mykeyword = df.iloc[i]["Word"]

    mylist = mylist.split()


    for word in mylist:

        if word == mykeyword:

            df.iloc[i]["Sentence"] = df.iloc[i]["Sentence"].replace(word, '')

    print(i)
    i=i 1
 

Однако цикл не удаляет значения. Каков наилучший способ достижения желаемого результата?

Ответ №1:

Как насчет чего-то вроде…

 def remove_name(r): 
    r['Sentence'] = [w for w in r['Sentence'] if w != r['Word']]
    return r

df.apply(remove_name,axis=1)

 

Apply позволяет нам выполнять подобные операции сразу, никаких итераций не требуется.

Ответ №2:

Вы можете использовать функцию удаления, чтобы удалить элемент из списка.

Синтаксис: list.remove(элемент)

Где «список» — это ваш список предложений, а «элемент» — это название вашего фрукта, которое нужно удалить.

Чтобы узнать больше о функции удаления, обратитесь к документам python или по этой ссылке: https://www.programiz.com/python-programming/methods/list/remove