Ошибка при допустимой задержке, а именно с водяными знаками

#apache-flink #flink-streaming

#apache-ошибка #ошибка при потоковой передаче

Вопрос:

В чем преимущество использования разрешенной задержки в Apache Flink? Например: почему бы не использовать водяные знаки (не более 10 единиц) вместо водяных знаков (не более 5 единиц) допустимая задержка (5 единиц)?

Ответ №1:

Допустимая задержка — это концепция в оконном API — это не конструкция общего назначения.

В случае водяных знаков допустимая задержка преимущество заключается в том, что окно будет запущено и выдаст некоторые (начальные) результаты, как только водяной знак достигнет времени окончания окна. Следовательно, меньше задержка перед тем, как окно выдаст некоторые результаты, с возможностью обновления результатов по мере поступления поздних событий — vs — подождите дольше и получите один результат.

Выберите то, что имеет больше смысла для вашего варианта использования. Например, у некоторых пользователей довольно короткие задержки при нанесении водяных знаков (измеряются в секундах), при этом допустимая задержка измеряется десятками минут. Они не были бы счастливы, если бы им всегда приходилось ждать 30 или 60 минут (например), чтобы получить какие-либо результаты.