Настройка правил оповещения

Алертинг (Оповещения) реализованы на основе VictoriaMetrics AlertManager и VictoriaMetrics AlertManagerConfig. Интерфейс доработан таким образом, чтобы минимизировать риск возникновения ошибок в процессе конфигурации.

Для настройки оповещений перейдите в клиентский кластер, раздел “Оповещения”.

Для настройки правил оповещения (alert) или запись (record) необходимо создать группы правил. Группы разделены логически, поэтому выбор типа правил вынесен на уровень конфигурации группы правил.

Группы правил оповещения

Чтобы создать группу правил оповещения перейдите на страницу “Группы правил оповещения”, нажмите кнопку “Добавить группу правил оповещения”. На открывшейся странице заполните сведения о группе правил:

  • Имя группы (обязательное);
  • Тип выражений (Prometheus/Graphite, по умолчанию Prometheus);
  • Тип правил в группе (оповещения (alert) или запись (record));
  • Как часто оцениваются правила в группе;
  • Сколько правил могут выполняться одновременно в группе.

После создания группы имя группы, тип выражений, тип правил - неизменяемые. Тип правила записывается в каждое правило, входящее в группу, в поле type.

Когда группа правил создана, перейдите в группу для добавления в нее правил. После создания группы правил экран изменяется. Верхняя часть экрана содержит сведения о группе. В нижней части пользователь может управлять правилами. В левой стороне расположен список правил. Вы можете добавить правило, нажав на + в списке правил. Добавление правила будет отображено в правой стороне экрана. Просмотр созданного правила будет отображено также в правой стороне нижней части экрана.

Обратите внимание! Группа правил и каждое правило в группе - отдельные объекты, поэтому кнопки сохранения вынесены отдельно для группы и для правила в группе. Удаление группы приводит к каскадному удалению правил.

Правила в группе

Правила могут быть с типом “оповещение” (alert) или “запись” (record).

  • Правила оповещения позволяют определять условия оповещения на основе выражений языка выражений Prometheus/Graphite и отправлять уведомления о срабатывании выражения.
  • Правила агрегации позволяют предварительно вычислить часто необходимые или затратные в вычислительном отношении выражения и сохранить их результат как новый набор временных рядов. Запрос предварительно вычисленного результата часто будет намного быстрее, чем выполнение исходного выражения каждый раз, когда оно необходимо. Это особенно полезно для информационных панелей, которым необходимо повторно запрашивать одно и то же выражение при каждом обновлении.

Правила оповещения

В конфигурацию правила входят:

  • Название правила (обязательное)
  • Время ожидания перед отправкой. Это временной лаг, в течение которого система ожидает, сохранится ли состояние, соответствующее выражению. Если состояние сохранится, алерт (оповещение) будет отправлен;
  • Критичность (будет записана в значение лейбла с ключом severity. Если нет подходящего уровня критичности оставьте в поле значение “Не выбрано” и задайте критичность с помощью лейбла)
  • Ссылка на решение (будет записана в значение аннотации с ключом runbook_url)
  • Короткое описание (будет записана в значение аннотации с ключом summary)
  • Описание (будет записана в значение аннотации с ключом description)
  • Выражение* (обязательное)
  • Лейблы
  • Аннотации

Уровни критичности:

  • Не выбрано (по умолчанию. Может использоваться в паре с выбранным вручную лейблом, не перезаписывает лейбл)
  • Авария (Emergency): система не может быть использована;
  • Тревога (Alert): требуется немедленная реакция;
  • Опасность (Critical): критическое состояние;
  • Ошибка (Error): состояние ошибки;
  • Предупреждение (Warning): состояние может привести к поломке;
  • Уведомление (Notice): в пределах нормы, но стоит обратить внимание;
  • Инфо (Info): информационное сообщение;
  • Отладка (Debug): сообщение для отладки системы.

Обратите внимание! Если вы создадите аннотацию с дублирующим ключом: description, summary или runbook_url, то такая аннотация будет перезаписана значением, введенным в теле правила.

После создания название не может быть изменено. На созданном правиле есть кнопки: “Сохранить”, “Удалить правило”.

Обратите внимание! По умолчанию оповещения маршрутизируются в кластер мониторинга VictoriaMetrics, находящийся в кластере управления. Вы можете увидеть сработавшие оповещения в интерфейсе клиентского кластера в разделе Оповещения/Просмотр оповещений.

Для настройки дополнительной маршрутизации необходимо создать получателей и маршруты. При необходимости добавления интервалов времени, в которые оповещения приходить не будут, задайте временные интервалы и укажите их в маршрутах.

Правила записи

В конфигурацию правила входят:

  • Название правила (обязательное);
  • Выражение* (обязательное);
  • Лейблы.

После создания название не может быть изменено. На созданном правиле есть кнопки: “Сохранить”, “Удалить правило”.