#python #pandas #dataframe #concatenation
#python #pandas #фрейм данных #конкатенация
Вопрос:
У меня есть фрейм данных со столбцом «Отдел» с 6 различными переменными.
Однако, когда я создал новый df, используя:
indicator = dept.groupby('Department')[['Assignment Status']].count()
df содержит две записи для «Операций R amp; D»:
Department Assignment Status
Business Services 17616
Operations 112958
Quality Assurance 28070
Quality Control 32860
Ramp;D Operations 63206
Ramp;D Operations 275
Это должно быть какое-то отличие формата от моего исходного df. Как я могу объединить эти две записи из столбца «Отдел».
Большое спасибо
Комментарии:
1. Попробуйте заменить оба значения на общее, а затем выполните groupby. Кажется, что у вас может быть дополнительное пространство в одном из них, поэтому, возможно, простой полосы может быть достаточно
2. Я бы посоветовал вам сначала удалить все пробелы из столбца отдела.
dept['Department'] = dept.Department.str.strip()
. А затем сделайте то, что вы хотите попробовать.
Ответ №1:
Я считаю, что эта проблема должна быть из-за пробелов в значениях, как предложили @CypherX и @Dani
# To remove the white spaces from both ends (left and right)
dept.Department = dept.Department.str.strip()
# Then perform the groupby operation
indicator = dept.groupby('Department')[['Assignment Status']].count()