Вывод данных путем установки лага в SQL Server

#sql #sql-server #datetime #lag

#sql #sql-сервер #дата-время #задержка

Вопрос:

У меня есть одна таблица, как показано ниже, в SQL Server, как показано ниже.

 SELECT * FROM OverlappingDateRanges
  
 Id          startDate                       EndDate
10001   2020-04-01 00:00:00.000     2020-05-25 00:00:00.000
10001   2020-05-26 00:00:00.000     2020-07-15 00:00:00.000
10001   2020-07-17 00:00:00.000     2020-08-15 00:00:00.000
10001   2020-08-16 00:00:00.000     2020-10-15 00:00:00.000
10001   2020-10-16 00:00:00.000     2020-12-31 00:00:00.000
10002   2020-05-01 00:00:00.000     2020-05-29 00:00:00.000
10002   2020-05-30 00:00:00.000     2020-07-08 00:00:00.000
10002   2020-07-09 00:00:00.000     2020-10-01 00:00:00.000
10002   2020-10-03 00:00:00.000     2020-12-31 00:00:00.000
  

Я хочу вывод, подобный приведенному ниже, где, если нет разницы в дате между датой окончания и следующей датой начала с тем же идентификатором, тогда дата будет продолжаться, и она должна прерваться, если дата окончания и следующая дата начала не указаны в continue.

Вывод должен быть:

   id          startDate                endDate
10001  2020-04-01 00:00:00.000    2020-07-15 00:00:00.000
10001  2020-07-17 00:00:00.000    2020-12-31 00:00:00.000
10002  2020-05-01 00:00:00.000    2020-10-01 00:00:00.000
10002  2020-10-03 00:00:00.000    2020-12-31 00:00:00.000
  

Ответ №1:

Это тип проблемы пробелов и островов. Определите, где начинается каждая строка вывода, посмотрев на конец предыдущей. Затем выполните кумулятивную сумму и агрегируйте:

 select id, min(startdate), max(enddate)
from (select t.*,
             sum(case when prev_enddate >= dateadd(day, -1, startdate) then 0 else 1
                 end) over (partition by id order by startdate) as grp
      from (select t.*,
                   lag(enddate) over (partition by id order by startdate) as prev_enddate
            from t
           ) t
     ) t
group by id, grp;
  

Здесь есть db<>fiddle .