pandas: сравнение двух столбцов в df, возврат комбинированных диапазонов значений по строкам

#pandas #dataframe

#pandas #фрейм данных

Вопрос:

У меня большой df, который выглядит как:

 test = pd.DataFrame({'start': [1, 1, 2, 8, 2000],
                     'end': [5, 3, 6, 9, 3000]})

start   end
0   1   5
1   1   3
2   2   6
3   8   9
4   2000    3000
  

Я хочу сравнить все строки test и получить объединенные диапазоны значений:

желаемый результат:

 start   end
0   1   6
1   8   9
2   2000    3000
  

Я знаю, что могу сравнивать внутри строки, например

 test['start'] < test['end]
  

Я просто не уверен в лучшем / быстром способе сравнения и объединения миллионов строк.

Комментарии:

1. Это проблема с интервалом слияния. Я считаю, что вам нужна пользовательская функция для решения этой проблемы.