Локальный алертинг

В платформе “Штурвал” для кластера управления по умолчанию реализован централизованный алертинг с размещением метрик и правил оповещения в кластере управления. При использовании централизованного алертинга доступна настройка правил оповещения из интерфейса кластера. При необходимости вы можете настроить локальный алертинг. При этом графический интерфейс настройки правил оповещения, маршрутов и блокировок будет недоступен.

Конфигурирование локального алертинга возможно с помощью кастомного ресурса VMRule и применения изменений к спецификации (ssc) компонента управления модуля мониторинга (VM Agent) (shturval-metrics-collector).

  1. Подготовьте ShturvalServicePatch для применения к спецификации (ssc) Компонента управления модуля мониторинга (shturval-metrics-collector), где включите локальную базу данных хранения метрик vmsingle и необходимые компоненты, как приведено в примере.
Пример ShturvalServicePatch
apiVersion: ops.shturval.tech/v1beta2
kind: ShturvalServicePatch
metadata:
  name: metrics-collector-vmsingle
spec:
  shturvalServiceConfigName: shturval-metrics-collector
  customvalues:
    defaultRules:
      create: true
    vmalert:
      enabled: true
    vmsingle:
      enabled: true
  1. В кластер управления загрузите с помощью импорта манифестов подготовленный ShturvalServicePatch.
Скриншот

collectormgmt_alertpatch

  1. Загрузите кастомный ресурс VMRule в кластер управления с помощью импорта манифеста.
Пример VMRule
apiVersion: operator.victoriametrics.com/v1beta1
kind: VMRule
metadata:
  labels:
    cluster: clustername
    monitoringid: "0"
    role: user
  name: <ваше значение параметра>
  namespace: victoria-metrics
spec:
  groups:
    - name: <ваше значение параметра>
      rules:
        - alert: <ваше значение параметра>
          annotations:
            message: <ваше значение параметра>
          expr: <ваше значение параметра>
          for: <ваше значение параметра>
          labels:
            <ваше значение>
Параметр Описание Тип данных Пример
metadata.name Имя правила string shturval-backup
groups.name Имя группы правил string shturval-backup
rules.alert Имя алерта (оповещения) string VeleroBackupPartialFailures
rules.annotations.message Текст сообщения в оповещении пользователю string Velero backup {{ $labels.schedule }} has {{ $value | humanizePercentage }} partialy failed backups
rules.expr Правило, ри выполнении которого будет отправлено оповещение string velero_backup_partial_failure_total{schedule!=""} / velero_backup_attempt_total{schedule!=""} > 0.25
rules.for Период времени ожидания перед отправкой оповещения string 15m
rules.labels Лейблы правила string severity: warning
  1. Настройте конфигурацию алертинга, например, маршрут и получателя.

Вы можете проверить работу локального алертинга.

×