#python #pandas #duplicates #rename
Вопрос:
У меня есть следующий фрейм данных на python: С разными компаниями и разными инвестиционными раундами только с нераскрытыми инвесторами. Основываясь на некоторых других расчетах, нам удалось получить «пустышку», если у нас есть «новый» нераскрытый инвестор типа A или B для одной из компаний. Правило состоит в том, что если сумма нераскрытых инвесторов типа A или B больше, чем сумма в раунде t, то новый инвестор типа A или B получает манекен.
Company_ID Customer_ID Investor_type Round Dummy amazon Undisclosed A 1 1 amazon Undisclosed B 2 1 amazon Undisclosed B 3 0 amazon Undisclosed A 3 0 amazon Undisclosed B 4 0 amazon Undisclosed B 4 1 amazon Undisclosed B 4 1 amazon Undisclosed B 5 0 amazon Undisclosed B 5 0 amazon Undisclosed B 5 0 amazon Undisclosed B 5 1 Apple Undisclosed A 1 1 Apple Undisclosed B 2 1 Apple Undisclosed B 3 0 Apple Undisclosed A 3 0 Apple Undisclosed B 4 0 Apple Undisclosed B 4 1 Apple Undisclosed B 4 1
Что мы хотим сделать, так это изменить названия нераскрытых фирм, чтобы отразить это. Т. Е. каждый раз, когда фиктивный = 1, это будет отражать новое название фирмы, например, как это:
Company_ID Customer_ID Investor_type Round Dummy amazon Undisclosed_1 A 1 1 amazon Undisclosed_2 B 2 1 amazon Undisclosed_2 B 3 0 amazon Undisclosed_1 A 3 0 amazon Undisclosed_2 B 4 0 amazon Undisclosed_3 B 4 1 amazon Undisclosed_4 B 4 1 amazon Undisclosed_2 B 5 0 amazon Undisclosed_3 B 5 0 amazon Undisclosed_4 B 5 0 amazon Undisclosed_5 B 5 1 Apple Undisclosed_6 A 1 1 Apple Undisclosed_7 B 2 1 Apple Undisclosed_7 B 3 0 Apple Undisclosed_6 A 3 0 Apple Undisclosed_7 B 4 0 Apple Undisclosed_8 B 4 1 Apple Undisclosed_9 B 4 1
Основная проблема заключается в том, чтобы заставить его делать это правильно с помощью «прыжков» вперед и назад, а также при переключении идентификатора компании с Нераскрытого_5 на Нераскрытый_6, как только идентификатор компании изменится на Apple. Это также работало бы без этого правила, т. Е. оно просто начинается с Нераскрытого_1. Перепробовал несколько кодов с несколькими циклами и т. Д., Но не могу заставить его работать, любая помощь будет очень признательна!
Комментарии:
1. Когда
Undisclosed
будет сброшен добавленный номер?2. Я не понимаю ни того, чего вы хотите, ни того, как вы туда попадаете. Пожалуйста, уточните и укажите желаемый результат.
3. Желаемый вывод находится во втором кадре данных, где все нераскрытые имеют номера после них (в столбце Customer_ID). Когда идентификатор компании переключается с Amazon на Apple, номер, добавленный к Нераскрытому, сбрасывается.