Аварийный сигнал AWS неожиданно переходит в состояние Ok

#amazon-web-services #cloudwatch-alarms

#amazon-web-services #cloudwatch — аварийные сигналы

Вопрос:

У меня есть настройка будильника в AWS cloudwatch, которая генерирует точку данных каждый час. Когда его значение больше или равно 1, он переходит в состояние ALARM. Ниже приведены настройки

введите описание изображения здесь

2 ноября он перешел в состояние ALARM, а затем вернулся в состояние OK через 3 часа. Я просто пытаюсь понять, почему потребовалось 3 часа, чтобы вернуться в состояние OK вместо 1 часа, потому что метрика выполняется каждый час.

Вот журналы, которые подтверждают, что метрика перешла из состояния ALARM в состояние OK за 3 часа.

введите описание изображения здесь

Ниже приведен график, который показывает значение точки данных каждый час.

введите описание изображения здесь

Ответ №1:

Вероятно, это связано с тем, что сигналы тревоги оцениваются на более длительный период, чем ваш 1 час. Период является диапазоном оценки. В вашем случае диапазон оценки может превышать ваш 1 час, поэтому для его изменения требуется больше времени.

На форуме AWS также есть тема об этом поведении с дополнительной информацией:

. Необъяснимая задержка между утечкой данных аварийного сигнала и изменением состояния аварийного сигнала

Комментарии:

1. В моем случае период оценки установлен равным 1 (см. Дополнительную конфигурацию на моем первом снимке экрана). Поэтому он не может длиться дольше 1 часа.

2. период оценки @Lokesh и диапазон оценки отличаются. Вы не можете контролировать диапазон.

3. Поскольку у меня нет контроля, знаете ли вы, какова его ценность?

4. @Lokesh На этот раз я не знаю. Но в ветке форума пишут, что это зависит от вашего периода. Поэтому, если ваш период оценки составляет 1 час, диапазон оценки будет больше. Они пишут: «CloudWatch пытается получить большее количество точек данных, чем указано в периодах оценки».

5. ОК. Это объясняет 3-часовую задержку при подаче сигнала тревоги. Спасибо