#python-3.x #pandas #dask
#python-3.x #панды #даск
Вопрос:
При выполнении приведенного ниже примера теста возникает следующая ошибка: что я делаю не так?
Ошибка: Исключение (‘Идентификатор столбца (столбцов) уже выбран’,)
Код:
import unittest
import dask
import pandas as pd
import dask.dataframe as dd
class TestDaskCustomAgg(unittest.TestCase):
def mode(self, x):
val = pd.Series.mode(x)
if val.empty:
return np.NaN
return val[0]
def test_get_transactions(self):
df = dask.datasets.timeseries()
custom_agg = dd.Aggregation('custom_agg', agg=lambda x: self.mode(x), chunk=lambda x0: self.mode(x0))
df.groupby('name').agg(custom_agg).compute()
Комментарии:
1. Пожалуйста, предоставьте полную обратную трассировку
2. Похоже, вы вызываете
Series.mode
фрейм данных? Что вы хотите, чтобы вывод был здесь — режим строк, времен и чисел с плавающей запятой — не очень полезное значение.