#python #pandas #dataframe
Вопрос:
У меня есть CSV-файл, и в одном столбце содержится общий объем продаж за день. Данные иногда вводились с пунктуацией, например, , . ?
по ошибке или просто в порядке учета. Я пытаюсь очистить данные. Однако я заметил , что когда я использую df['Sales'].dtypes
I get object
, это правильный тип данных. Однако, когда я запустил value_counts, внизу был указан dtype int64
.
df['Sales'].value_counts(dropna=False)
...
12400 3
12000 1
Name: Sales, dtype: int64
Почему dtype изменился на int64? В настоящее время тип данных должен быть object?
Ответ №1:
df.value_counts возвращает количество уникальных значений в df. Это значение представляет собой число, таким образом, тип: int64. Надеюсь, это вам помогло.