#python #pandas #dataframe #csv #k-means
#python #панды #фрейм данных #csv #k-означает
Вопрос:
У меня есть фрейм данных pandas, где у меня есть два столбца с именами «crashtype» и «crashloc». Я применил кластеризацию K-средних и создал новый столбец с именем «Кластеры» для хранения значений кластера. Теперь я хочу напечатать значения кластера 1 «crashloc», где «crahtype» ==»Подозрение на серьезную травму» Как это сделать?
Ответ №1:
Вот ответ: сначала выберите строки, которые соответствуют вашему условию
df1 = df.loc[df.crahtype =='Suspected Serious Injury']
Затем вы можете напечатать значение в любом нужном столбце
print(df1["Clusters"])
Комментарии:
1. Пожалуйста, если это решит вашу проблему, не могли бы вы отметить вопрос как ответ
Ответ №2:
На самом деле я решил свою проблему следующим образом
df1 = df.loc[df["crashtype"] =='Suspected Serious Injury']
df2 = df1.loc[df1["CLUSTERS"] ==1]
print(df2["crashloc"].value_counts())
Вывод-
Non-Intersection 72
Non-Roadway 24
Intersection 12
Intersection-Related 5
Name: crashloc, dtype: int64
Итак, у меня есть 10 кластеров с пометкой 0-9, и я хотел извлечь значения «crashloc» из кластера с пометкой 1, где «crashtype» == «Подозрение на серьезную травму», и вот как я это сделал 🙂