#python
Вопрос:
я ищу значения use_counts во многих столбцах, и я знаю, что могу их использовать df.island.value_counts()
, но мне нужен цикл или что-то более эффективное, чтобы не указывать имя каждого столбца фрейма данных. Важно сказать, что я знаю конкретные столбцы, в которых я хочу применить эту функцию. Код, который я использую, это:
data_url = "https://raw.githubusercontent.com/cmdlinetips/data/master/palmer_penguins.csv"
df = pd.read_csv(data_url)
df.select_dtypes(object).head() # I use this to know the columns that has variables categorical. I want this because i'm looking to know what categorical variables they has, and that is why i'm using value_count
df.island.value_counts()
Ответ №1:
categories = df.select_dtypes(object).head() # this is a dataframe object
categorical_columns = categories.columns # this is an iterable which contains strings of column headers
counter_dict = {}
# loop through each column, add values to dict
for column in categorical_columns:
counter_dict[column] = df[column].value_counts()
# each item in dict has column title as key and value_counts series as value
Комментарии:
1. Тэтчер, спасибо!! ваше предложение отлично работает в моем коде!!
2. Пожалуйста, примите мой ответ, чтобы этот вопрос можно было закрыть, если вам больше ничего не нужно.