Python: переименовывайте дубликаты в зависимости от различных условий

#python #pandas #duplicates #rename

Вопрос:

У меня есть следующий фрейм данных на python: С разными компаниями и разными инвестиционными раундами только с нераскрытыми инвесторами. Основываясь на некоторых других расчетах, нам удалось получить «пустышку», если у нас есть «новый» нераскрытый инвестор типа A или B для одной из компаний. Правило состоит в том, что если сумма нераскрытых инвесторов типа A или B больше, чем сумма в раунде t, то новый инвестор типа A или B получает манекен.

 Company_ID Customer_ID Investor_type Round Dummy   amazon Undisclosed A 1 1   amazon Undisclosed B 2 1   amazon Undisclosed B 3 0   amazon Undisclosed A 3 0   amazon Undisclosed B 4 0   amazon Undisclosed B 4 1   amazon Undisclosed B 4 1   amazon Undisclosed B 5 0   amazon Undisclosed B 5 0   amazon Undisclosed B 5 0   amazon Undisclosed B 5 1   Apple Undisclosed A 1 1   Apple Undisclosed B 2 1   Apple Undisclosed B 3 0   Apple Undisclosed A 3 0   Apple Undisclosed B 4 0   Apple Undisclosed B 4 1   Apple Undisclosed B 4 1   

Что мы хотим сделать, так это изменить названия нераскрытых фирм, чтобы отразить это. Т. Е. каждый раз, когда фиктивный = 1, это будет отражать новое название фирмы, например, как это:

 Company_ID Customer_ID Investor_type Round Dummy   amazon Undisclosed_1 A 1 1   amazon Undisclosed_2 B 2 1   amazon Undisclosed_2 B 3 0   amazon Undisclosed_1 A 3 0   amazon Undisclosed_2 B 4 0   amazon Undisclosed_3 B 4 1   amazon Undisclosed_4 B 4 1   amazon Undisclosed_2 B 5 0   amazon Undisclosed_3 B 5 0   amazon Undisclosed_4 B 5 0   amazon Undisclosed_5 B 5 1   Apple Undisclosed_6 A 1 1   Apple Undisclosed_7 B 2 1   Apple Undisclosed_7 B 3 0   Apple Undisclosed_6 A 3 0   Apple Undisclosed_7 B 4 0   Apple Undisclosed_8 B 4 1   Apple Undisclosed_9 B 4 1   

Основная проблема заключается в том, чтобы заставить его делать это правильно с помощью «прыжков» вперед и назад, а также при переключении идентификатора компании с Нераскрытого_5 на Нераскрытый_6, как только идентификатор компании изменится на Apple. Это также работало бы без этого правила, т. Е. оно просто начинается с Нераскрытого_1. Перепробовал несколько кодов с несколькими циклами и т. Д., Но не могу заставить его работать, любая помощь будет очень признательна!

Комментарии:

1. Когда Undisclosed будет сброшен добавленный номер?

2. Я не понимаю ни того, чего вы хотите, ни того, как вы туда попадаете. Пожалуйста, уточните и укажите желаемый результат.

3. Желаемый вывод находится во втором кадре данных, где все нераскрытые имеют номера после них (в столбце Customer_ID). Когда идентификатор компании переключается с Amazon на Apple, номер, добавленный к Нераскрытому, сбрасывается.