Панды и словарь: Как получить все уникальные значения для каждого ключа?

#python #pandas

Вопрос:

Я хочу создать словарь таким образом, чтобы значение в паре ключ-значение было каждым уникальным значением для этого ключа.

Рассмотрим этот пример:

 df = pd.DataFrame({'id': [1, 2, 3, 1, 2, 3], 'vals': ['a1', 'a2', 'a3', 'a2', 'a2a', 'a3a']})

# only yields last entry
dict(zip(df['id'], df['vals']))
# results
{1: 'a2', 2: 'a2a', 3: 'a3a'}

# expected value
{1: ['a1', 'a2'], 2: ['a2', 'a2a'], 3: ['a3', 'a3a']}

Ответ №1:

Воспользуйся:

 result = df.groupby("id")["vals"].agg(list).to_dict()
print(result)

Выход

 {1: ['a1', 'a2'], 2: ['a2', 'a2a'], 3: ['a3', 'a3a']}

Ответ №2:

Вы могли бы использовать понимание под диктовку, например, так:

 {k: group['vals'].tolist() for k, group in df.groupby('id')}

какие результаты

 {1: ['a1', 'a2'], 2: ['a2', 'a2a'], 3: ['a3', 'a3a']}

Ответ №3:

 print(df.groupby('id')['vals'].apply(lambda x: x.tolist()).to_dict())

Панды и словарь: Как получить все уникальные значения для каждого ключа?

Вопрос:

Комментарии:

Ответ №1:

Ответ №2:

Комментарии:

Ответ №3:

Вопрос:

Комментарии:

Ответ №1:

Ответ №2:

Комментарии:

Ответ №3:

Вам также может понравиться

Пытаюсь создать базу данных комнат с Android, но продолжаю получать ошибку зависимости

Как справиться с идеей «множества маленьких функций» для классов, не передавая большого количества параметров?

Sitefinity 4 с LINQ на SQL?