Наиболее эффективный способ заполнения категориальных NAS на основе обработки строк

#pandas #string #lambda #apply

#pandas #строка #лямбда #применить

Вопрос:

У меня есть два столбца: age и n_age . n_age является числом; age является категорией десятилетия. Например, age может быть 56 , и n_age будет 50s .

Я заполнил NA s n_age столбца случайной выборкой. Теперь я хотел бы использовать наиболее эффективный метод заполнения age столбца. Я использовал an apply с a lambda , например, так:

 df['age'].fillna(df['n_age'].apply(lambda x: str(x//10) '0s'))
  

К счастью, мой набор данных относительно невелик, так что это не заняло много времени. Я полагаю, что есть более эффективный способ сделать это — какой способ лучше?

Ответ №1:

Нет необходимости применять

 (df['age'].fillna(df['n_age'])//10).mul(10).astype(str) 's'