Ошибка при вызове Dask groupby с пользовательским агрегатом

#python-3.x #pandas #dask

#python-3.x #панды #даск

Вопрос:

При выполнении приведенного ниже примера теста возникает следующая ошибка: что я делаю не так?

Ошибка: Исключение (‘Идентификатор столбца (столбцов) уже выбран’,)

Код:

 import unittest
import dask
import pandas as pd
import dask.dataframe as dd

class TestDaskCustomAgg(unittest.TestCase):

    def mode(self, x):
        val = pd.Series.mode(x)
        if val.empty:
            return np.NaN
        return val[0]
  
    def test_get_transactions(self):
        df = dask.datasets.timeseries()
        custom_agg = dd.Aggregation('custom_agg', agg=lambda x: self.mode(x), chunk=lambda x0: self.mode(x0))
        df.groupby('name').agg(custom_agg).compute()
   
 

Комментарии:

1. Пожалуйста, предоставьте полную обратную трассировку

2. Похоже, вы вызываете Series.mode фрейм данных? Что вы хотите, чтобы вывод был здесь — режим строк, времен и чисел с плавающей запятой — не очень полезное значение.