pandas: сравнение двух столбцов в df, возврат комбинированных диапазонов значений по строкам

#pandas #dataframe

#pandas #фрейм данных

Вопрос:

У меня большой df, который выглядит как:

 test = pd.DataFrame({'start': [1, 1, 2, 8, 2000],
                     'end': [5, 3, 6, 9, 3000]})

start   end
0   1   5
1   1   3
2   2   6
3   8   9
4   2000    3000

Я хочу сравнить все строки test и получить объединенные диапазоны значений:

желаемый результат:

 start   end
0   1   6
1   8   9
2   2000    3000

Я знаю, что могу сравнивать внутри строки, например

 test['start'] < test['end]

Я просто не уверен в лучшем / быстром способе сравнения и объединения миллионов строк.

Вопрос:

Комментарии:

Вам также может понравиться

Векторная функция push_back (), разница во времени при добавлении в нее списка

Заполнить суррогатный ключ даты на основе даты в столбце

Данные временной метки Groupby в r