#pandas #dataframe
#pandas #фрейм данных
Вопрос:
У меня большой df, который выглядит как:
test = pd.DataFrame({'start': [1, 1, 2, 8, 2000],
'end': [5, 3, 6, 9, 3000]})
start end
0 1 5
1 1 3
2 2 6
3 8 9
4 2000 3000
Я хочу сравнить все строки test
и получить объединенные диапазоны значений:
желаемый результат:
start end
0 1 6
1 8 9
2 2000 3000
Я знаю, что могу сравнивать внутри строки, например
test['start'] < test['end]
Я просто не уверен в лучшем / быстром способе сравнения и объединения миллионов строк.
Комментарии:
1. Это проблема с интервалом слияния. Я считаю, что вам нужна пользовательская функция для решения этой проблемы.