Анализ состояния в платформе Штурвал

Для осуществления непрерывного анализа состояния работы компонентов и приложений в составе платформы поставляются:

модуль локального сбора логов;
модуль централизованного хранения логов;
модуль графического отображения логов;
модуль локального сбора метрик;
внешний модуль графического отображения метрик.

Мониторинг

Для сбора метрик в составе платформы поставляется VM Agent. Он входит в состав рекомендуемых системных сервисов при инсталляции клиентского кластера. VM Agent по умолчанию собирает метрики системных компонентов и перенаправляет их в кластер Victoria Metrics, размещенный в кластере управления.

Собранные метрики доступны для просмотра в предварительно настроенных дашбордах Grafana . Есть возможность дополнительной настройки конфигурации установленных сервисов, перенаправления метрик из VM Agent, а также замены сервисов на корпоративные.

Алертинг

На основе полученных метрик в кластере Victoria Metrics формируются алерты. Отчет об алертах доступен в интерфейсе клиентского кластера.

В платформе для кластеров по умолчанию реализован централизованный алертинг с размещением правил оповещения в кластере управления. Также есть возможность настроить локальный алертинг в кластерах.

Для настройки правил оповещения и агрегации в составе платформы поставляется VM Alert Manager .

Дополнительно есть возможность настройки отправки алертов по различным каналам:

Обратите внимание! Для получения оповещений по e-mail:

на стороне сервера должны быть открыты порты 25 и/или 587 для SMTP, 465 для SMTPS;
при централизованном алертинге в кластере управления платформы “Штурвал” не установлено ограничений на выход по перечисленным портам;
при локальном алертинге в клиентском кластере платформы “Штурвал” не установлено ограничений на выход по перечисленным портам.

Логирование

Для сбора логов в клиентских кластерах и кластере управления поставляется Vector. Ведется запись логов:

аутентификации;
backend;
аудита;
всех системных компонентов;
приложений пользовательской нагрузки.

Собранные логи маршрутизируются в кластер управления в модуль централизованного хранения логов - OpenSearch. Есть возможность настроить перенаправление логов до или после доставки в OpenSearch.

В случае потери доступности кластера управления буфер хранения логов по умолчанию = 100 МБ для каждого узла.

Переход в OpenSearch доступен из дашборда клиентского кластера и кластера управления. Переход осуществляется по SSO с сохранением прав доступа пользователей.

По умолчанию в OpenSearch будут созданы индексы для кластера и Kube-Audit логов, а также настроена политика ротации логов .

Анализ состояния в платформе Штурвал

Мониторинг #

Алертинг #

Логирование #

Мониторинг

Алертинг

Логирование