Kubernetes

Kubernetes/API-сервер

Дашборд предназначен для мониторинга состояния API-серверов в окружении Kubernetes. Он предоставляет возможности отслеживания доступности и производительности запросов к API, позволяя анализировать как входящие (читающие) так и исходящие (записывающие) операции. С помощью этого инструмента можно оперативно выявлять ошибки и аномалии в работе сервисов, что критически важно для обеспечения устойчивости и надежности приложений.

Скриншот

Структура дашборда

Доступность (30d) > 99.000%: Отображает процент успешных запросов к API за последние 30 дней.
Запас ошибок (30d) > 99.000%: График, показывающий запас по ошибкам, остающимся при гарантии доступности 0,990%.
Доступность чтения (30d): Отображает процент успешных запросов на чтение (LIST, GET) за последние 30 дней.
Чтение SLI - Запросы: График, показывающий количество запросов на чтение (LIST, GET) в секунду по кодам ответов.
Чтение SLI - Ошибки: График, отображающий процент ошибок (5xx) среди запросов на чтение.
Чтение SLI - Продолжительность: График, показывающий 99-й процентиль времени выполнения запросов на чтение. SLI метрики только на Control Plane /за более продолжительный срок
Доступность записи (30d): Отображает процент успешных запросов на запись (POST, PUT, PATCH,DELETE) за последние 30 дней.
Запись SLI - Запросы: График, показывающий количество запросов на запись в секунду по кодам ответов.
Запись SLI - Ошибки: График, показывающий процент ошибок (5xx) среди запросов на запись.
Запись SLI - Продолжительность: График, показывающий 99-й процентиль времени выполнения запросов на запись. SLI метрики только на Control Plane /за более продолжительный срок
Скорость добавления в рабочую очередь: График, отображающий общее количество добавлений в рабочую очередь в секунду.
Глубина рабочей очереди: График, показывающий количество операций ввода-вывода,обрабатываемых одновременно в очереди.
Задержка в рабочей очереди: График, показывающий, сколько времени в секундах элемент остается в очереди перед обработкой.
Использование памяти: График, отображающий объем используемой памяти (в байтах) для API-серверов.
Использование ЦП: График, показывающий, какое время процесс использовал в последнюю единицу времени.
Go-рутины: График, отображающий количество активных Go-рутинов.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных, используемый для отображения метрик.
service: Позволяет выбрать сервис, для которого будут фильтроваться метрики, или выбрать все сервисы (All) кластера.

Kubernetes/Controller Manager

Дашборд предназначен для мониторинга Kubernetes Controller Manager и предоставляет пользователям возможность отслеживать состояние и производительность компонентов системы. С его помощью можно наблюдать важные метрики, такие как количество запущенных процессов, интенсивность добавлений в рабочую очередь, задержки запросов Kube API и использование системных ресурсов. Период обновления данных составляет 10 секунд, что позволяет получать актуальную информацию о работе кластеров в режиме реального времени.

Скриншот

Структура дашборда

Запущено: Отображает общее количество запущенных экземпляров Kube Controller Manager на выбранном кластере.
Интенсивность добавления в рабочую очередь: График, показывающий суммарное количество добавлений в рабочую очередь с разбивкой по кластеру и подам.
Глубина рабочей очереди: График, отображающий количество операций ввода-вывода, которые могут одновременно обрабатываться системой.
Задержка рабочей очереди: График, который показывает время, в течение которого элемент остается в рабочей очереди перед его обработкой.
Интенсивность запросов Kube API: График, который отображает общее количество клиентских запросов к Kube API с разбивкой по коду ответа.
Задержка GET-запросов (99-й квантиль): График, показывающий задержку GET-запросов в секундах, с разбивкой по типу запроса и URL.
Задержка POST-запросов (99-й квантиль): График, отображающий задержку POST-запросов в секундах с разбивкой по типу запроса и URL.
Использование памяти: График, показывающий объем используемой памяти (в байтах) для каждого пода Kube Controller Manager.
Использование ЦП: График, отображающий процессорное время, использованное последним объектом каждого пода за единицу времени.
Go-рутины: График, показывающий количество активных Go-рутин в каждом поде.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
pod: Позволяет выбрать один под для мониторинга или все поды на выбранном кластере.

Kubernetes/ETCD Cluster Health

Дашборд предназначен для мониторинга здоровья кластера ETCD в окружении Kubernetes. Он интегрирован с системой сбора метрик VM Agent и предоставляет подробную информацию о работе ETCD, включая статус лидерства, количество изменений лидеров, размер базы данных, пропускную способность и различные метрики производительности. Пользователи могут отслеживать ключевые показатели эффективности и настраивать оповещения для повышения надежности и стабильности кластера.

Скриншот

Структура дашборда

ETCD Cluster View:
- Etcd has a leader?: Отображает информацию о наличии лидера в кластере ETCD.
- The total number of failed proposals seen: Показывает общее количество неудачных предложений в кластере.
- DB Size: График, отображающий оценку общего размера базы данных, представлена как граф и статистика.
- The number of leader changes seen: Количество изменений лидеров в кластере.
- ETCD rps: Показывает количество запросов в секунду к ETCD.
- RPS Successful Rate: График, отображающий успешные запросы в секунду, представлены как граф и статистика.
- Members State: Таблица состояния членов кластера, показывает, кто из них является лидером.
- RPS Failed Rate: График, отображающий невыполненные запросы в секунду, представлены как граф и статистика.
Detailed:
- Memory: График, отображающий использование памяти процессом пода ETCD.
- RPS Failed Rate: График неудачных запросов в секунду по подам.
- Disk Sync Duration: График, отображающий продолжительность синхронизации на диске, представлена как график с 99-ым процентилем.
- Disk Compact Duration: График, показывающий время сжатия на диске, показано дважды; один из графиков - с 99-ым процентилем.
- Heartbeat Failures: График, показывающий количество сбоев отправки heartbeat.
- Raft Proposals: График, показывающий общие метрики предложений Raft, включая уровень успешных и неудачных предложений.
- Proposals pending: График, показывающий количество ожидающих предложений.
- The total number of consensus proposals committed: Общее количество предложений, согласованных в кластере.
- Client Traffic In: График входящего трафика от клиентов.
- Client Traffic Out: График исходящего трафика к клиентам.
- Total Leader Elections Per Day: График, показывающий общее количество выборов лидеров в день.
- Peer Traffic In: График, показывающий входящий трафик между узлами кластера.
- Peer Traffic Out: График, показывающий исходящий трафик между узлами кластера.
- Disks operations: График операций с дисками.
- Network: Графики общего трафика клиентов, как входящего, так и исходящего.
- Snapshot duration: График, показывающий длительность снимков, устанавливает возможные проблемы с диском.
Alerts:
- ETCD disk io latency alerts: График, показывающий оповещения по задержкам ввода-вывода на диске ETCD.
- alert if 99th percentile of round trips take 150ms: График, показывающий оповещения при превышении 150 мс для 99-го процентиля времени обратного движения.
- ETCD Status: График, показывающий статус системы ETCD, показывает общий статус подов.
- ETCD Leader Changes Alert: График, показывающий предупреждения об изменениях лидера в кластере.
- Disk Compact Duration: График, показывающий оповещения по времени сжатия на диске.
- Disk Sync Duration: График, показывающий оповещения по времени синхронизации на диске.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.

Kubernetes/Ingress

Дашборд предназначен для мониторинга операторов NGINX Ingress в Kubernetes. Он позволяет пользователям отслеживать различные метрики, такие как объем запросов, коэффициенты успешности, нагрузки на сеть и использование ресурсов, а также осуществлять аналитику производительности Ingress-контроллеров. Благодаря графическому представлению данных и настраиваемым параметрам, пользователи могут легко отслеживать состояние своих приложений и выявлять потенциальные проблемы с производительностью.

Скриншот

Структура дашборда

Controller Request Volume: Отображает объем запросов, обработанных контроллером Ingress.
Controller Connections: Показывает количество активных соединений контроллера NGINX.
Controller Success Rate (non-4|5xx responses): График, отображающий процент успешных ответов(коды ответов не 4xx и не 5xx).
Config Reloads: Отображает частоту перезагрузки конфигурации контроллера.
Last Config Failed: Отображает количество неудачных попыток перезагрузки последней конфигурации.
Ingress Request Volume: Временной график, показывающий объем запросов к определенному Ingress.
Ingress Success Rate (non-4|5xx responses): Процент успешных ответов для конкретного Ingress.
Network I/O pressure: Графики, показывающие входящее и исходящее сетевое давление.
Average Memory Usage: График, показывающий среднее значение потребляемой памяти контроллером NGINX.
Average CPU Usage: График, показывающий среднее значение загрузки ЦП контроллером NGINX.
Ingress Percentile Response Times and Transfer Rates: Таблица, отображающая процентильные времена ответа и объем передаваемых данных для Ingress.
Ingress Percentile Response Times (Ingress Namespaces): Временные ряды процентов по времени ответа для различных Ingress.
Ingress Request Latency Heatmap (Ingress Namespaces): Тепловая карта, показывающая задержку по запросам для Ingress.
Ingress Certificate Expiry: Таблица с информацией о времени истечения сертификатов для Ingress.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
namespace: Позволяет выбрать неймспейса, в котором работает контроллер Ingress.
controller_class: Позволяет выбрать класс контроллера для фильтрации метрик.
controller: Позволяет выбрать под контроллера для отслеживания метрик.
exported_namespace: Позволяет выбрать неймспейс Ingress для анализа запросов.
ingress: Позволяет выбрать конкретный Ingress для мониторинга его метрик.

Kubernetes/Кубелет

Дашборд предназначен для мониторинга состояния кластеров Kubernetes с использованием данных, получаемых через Kubelet. Он отображает ключевые метрики, такие как количество запущенных контейнеров, подов, а также время выполнения операций, что позволяет администраторам и DevOps-командам эффективно управлять ресурсами и реагировать на потенциальные проблемы.

Скриншот

Структура дашборда

Запущенные Kubelet: Отображает суммарное количество всех запущенных Kubelet.
Запущенные поды: Отображает суммарное количество всех запущенных подов с разделением по узлам.
Запущенные контейнеры: Отображает суммарное количество всех запущенных контейнеров с разделением по узлам.
Фактическое кол-во томов: Отображает суммарное количество всех используемых томов.
Требуемое количество томов: Отображает суммарное количество необходимых для исправной работы томов.
Кол-во конфиг. ошибок: Отображает суммарное количество конфигурационных ошибок Kubelet.
Интенсивность работы (оп./с): График, отображающий количество операций в секунду по выполнению операций различных типов.
Интенсивность нарушений работы (оп./с): График, отображающий количество операций в секунду, затраченных на отдельные задачами Kubelet.
Длительность работы (99-й квантиль): График, отображающий 99-й квантиль количества операций в секунду некорректной работы Kubelet.
Интенсивность запуска подов (оп./с): График, отображающий время, затрачиваемое на запуск подов с разделением по узлам.
Длительность запуска подов (99-й квантиль): График, отображающий 99-й квантиль длительности запуска подов.
Интенсивность работы хранилища (оп./с): График, отображающий количество операций в секунду, затраченных на выполнение операций с хранилищами.
Интенсивность нарушений работы хранилища (оп./с): График, отображающий количество операций в секунду некорректной работы хранилища.
Продолжительность работы хранилища (99-й квантиль): График, отображающий 99-й квантиль времени выполнения операций с хранилищем.
Интенсивность обновления PLEG (оп./с): Количество операций в секунду, выполняемых генератором событий PLEG.
Период обновления списка PLEG (99-й квантиль): График, отображающий 99-й квантиль времени обновления списка PLEG.
Продолжительность обновления списка PLEG (99-й квантиль): График, отображающий 99-й квантиль времени обновления списка PLEG.
Интенсивность удаленных вызовов (RPC): График, отображающий суммарное количество удаленных клиентских запросов в секунду, распределенных по кодам ответа.
Длительность запросов (99-й квантиль): График, отображающий 99-й квантиль продолжительности запросов к API.
Память: График, отображающий объем памяти, использованной Kubelet.
Использование ЦП: График, отображающий процессорное время, затраченное Kubelet.
Go-рутины: График, отображающий количество горутин, используемых Kubelet.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
node: Позволяет выбрать узел для мониторинга. Доступные узлы берутся из данных кластера.

Kubernetes/Networking/Cluster

Дашборд предназначен для мониторинга сетевой активности кластеров Kubernetes. Он предоставляет детальную информацию о передаче и получении данных, а также о состоянии сети в рамках кластеров. С помощью этого дашборда пользователи могут отслеживать ключевые метрики, такие как скорость передачи байтов, количество переданных и полученных пакетов, а также количество потерянных пакетов, что является важной частью обеспечения стабильности и производительности приложений, работающих в контейнерах.

Скриншот

Структура дашборда

Current Rate of Bytes Received: График, показывающий текущую скорость получения байтов по неймспейсу в кластере.
Current Rate of Bytes Transmitted:График, показывающий текущую скорость передачи байтов по неймспейсу.
Current Status: Таблица, в которой отображаются текущие метрики по полученным и переданным байтам, средние значения, а также количество принятых и переданных пакетов и число потерянных пакетов.
Average Rate of Bytes Received: График, показывающий среднюю скорость получения байтов по неймспейсу.
Average Rate of Bytes Transmitted: График, показывающий среднюю скорость передачи байтов по неймспейсу.
Receive Bandwidth:График, показывающий полосу пропускания для получения трафика по неймспейсу.
Transmit Bandwidth: График, показывающий полосу пропускания для передачи трафика по неймспейсу.
Rate of Received Packets: График, показывающий скорость получения пакетов по неймспейсу.
Rate of Transmitted Packets: График, показывающий скорость передачи пакетов по неймспейсу.
Rate of Received Packets Dropped: График, показывающий скорость потерянных пакетов при получении по неймспейсу.
Rate of Transmitted Packets Dropped: График, показывающий скорость потерянных пакетов припередаче по неймспейсу.
Rate of TCP Retransmits out of all sent segments: График, показывающий скорость повторной передачи TCP сегментов из всех отправленных сегментов.
Rate of TCP SYN Retransmits out of all retransmits: График, показывающий скорость повторной передачи TCP SYN из всех повторных передач.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
cluster: Позволяет пользователю выбрать конкретный кластер, данные о котором будут отображаться на дашборде, извлекая значения метки из данных, получаемых от Kubelet.

Kubernetes/Networking/Namespace (Pods)

Дашборд предназначен для мониторинга сетевой активности подов в кластере Kubernetes. Он предоставляет визуализацию различных метрик, связанных с передачей и приемом сетевых данных, а также количеством переданных и потерянных пакетов. Дашборд позволяет администраторам и разработчикам отслеживать состояние сетевой активности в реальном времени, что критически важно для оптимизации производительности приложений и обеспечения стабильности работы контейнеризованных сервисов.

Скриншот

Структура дашборда

Current Rate of Bytes Received: Панель отображает текущую скорость приема байт от подов в выбранном кластере и неймспейсе.
Current Rate of Bytes Transmitted: Панель показывает текущую скорость передачи байт от подов.
Current Network Usage: Таблица, в которой представлены метрики по сетевому использованию для каждого пода, включая скорость получения и передачи байт, скорость получения и передачи пакетов, а также количество потерянных пакетов.
Receive Bandwidth: Временной графи, отображающий скорость приема байт по подам.
Transmit Bandwidth: Временной график, показывающий скорость передачи байт по подам.
Rate of Received Packets: Временной график для мониторинга скорости получения пакетов по подам.
Rate of Transmitted Packets: Временной график для мониторинга скорости передачи пакетов по подам.
Rate of Received Packets Dropped: Временной график, показывающий скорость потерь пакетов при получении, сгруппированных по неймспейсу.
Rate of Transmitted Packets Dropped: Временной график, отображающий скорость потерь пакетов при передаче по подам.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.

Kubernetes/Networking/Namespace (Workload)

Дашборд предназначен для мониторинга сетевой активности контейнеров в окружении Kubernetes. Он предоставляет пользователю возможность отслеживать различные метрики, связанные с получением и передачей данных, а также состоянием сетевых ресурсов на уровне неймспейсов. Дашборд помогает оперативно выявлять проблемы и оптимизировать сетевую производительность путем анализа входящего и исходящего трафика, а также статистики по потерянным пакетам.

Скриншот

Структура дашборда

Current Rate of Bytes Received: Отображает текущую скорость получения байтов в контейнерах, по различным рабочим нагрузкам.
Current Rate of Bytes Transmitted: Отображает текущую скорость передачи байтов из контейнеров.
Current Status: Сводная таблица состояния, показывающая количество полученных и переданных байтов, а также пакетную активность (количество принятых и переданных пакетов).
Receive Bandwidth: График, отображающий объем полученного трафика в байтах.
Transmit Bandwidth: График, показывающий объем переданного трафика в байтах.
Average Container Bandwidth by Workload: Received: Средняя скорость получения данных контейнерами по рабочим нагрузкам.
Average Container Bandwidth by Workload: Transmitted: Средняя скорость передачи данных контейнерами по рабочим нагрузкам.
Rate of Received Packets: График, показывающий скорость получения пакетов.
Rate of Transmitted Packets: График, показывающий скорость передачи пакетов.
Rate of Received Packets Dropped: График, отображающий скорость потерянных пакетов при получении.
Rate of Transmitted Packets Dropped: График, отображающий скорость потерянных пакетов при передаче.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для запроса метрик, заданный в формате VM Agent.
namespace: Позволяет отфильтровать метрики по определенному неймспейсу в кластере.
type: Позволяет выбрать тип рабочей нагрузки.

Kubernetes/Networking/Pod

Дашборд предназначен для мониторинга сетевых показателей в среде Kubernetes. Он предоставляет пользователю возможность отслеживать текущие параметры сети, такие как скорость получения и передачи данных, а также количество пакетов, полученных и отправленных контейнерами. Дашборд использует данные из VM Agent для визуализации метрик, что позволяет быстро выявлять проблемы с сетью и анализировать производительность приложений.

Скриншот

Структура дашборда

Current Rate of Bytes Received: Отображает текущую скорость получения байтов по указанному кластеру, неймспейсу и поду.
Current Rate of Bytes Transmitted: Показывает текущую скорость передачи байтов для заданных параметров.
Receive Bandwidth: Временной график, отображающий скорость получения данных для каждого пода на протяжении времени.
Transmit Bandwidth: Временной график, показывающий скорость передачи данных для каждого пода.
Rate of Received Packets: Временной график, показывающий скорость получения пакетов сети, сгруппированных по подам.
Rate of Transmitted Packets: Временной график, показывающий скорость передачи пакетов в сети для каждого пода.
Rate of Received Packets Dropped: Временной график, показывающий скорость потерянных пакетов, полученных по сети, для каждого пода.
Rate of Transmitted Packets Dropped: Временной график, показывающий скорость потерянных пакетов на уровне передачи для каждого пода.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
namespace: Позволяет выбрать неймспейс, для которого будут отображаться метрики.
pod: Позволяет выбрать один под для мониторинга или все поды на выбранном кластере.

Kubernetes/Networking/Workload

Дашборд предназначен для мониторинга сетевых показателей в средах Kubernetes. Он предоставляет пользователям возможность отслеживать текущие и средние скорости приема и передачи байтов, а также количество полученных и переданных пакетов. Это особенно полезно для администраторов и разработчиков, ответственных за производительность и надежность приложений, работающих в кластерах Kubernetes. Дашборд освещает критические метрики, которые помогают выявлять узкие места в сетевом взаимодействии рабочих нагрузок.

Скриншот

Структура дашборда

Current Rate of Bytes Received: Отображает текущую скорость приема байтов в секундах для выбранных рабочих нагрузок.
Current Rate of Bytes Transmitted: Отображает текущую скорость передачи байтов в секундах для выбранных рабочих нагрузок.
Average Rate of Bytes Received: Отображает среднюю скорость приема байтов для выбранных рабочих нагрузок.
Average Rate of Bytes Transmitted: Отображает среднюю скорость передачи байтов для выбранных рабочих нагрузок.
Receive Bandwidth: График потребляемой полосы пропускания для получаемых байтов.
Transmit Bandwidth: График потребляемой полосы пропускания для передаваемых байтов.
Rate of Received Packets: График, показывающий скорость получения пакетов в секунду для выбранных рабочих нагрузок.
Rate of Transmitted Packets: График, показывающий скорость передачи пакетов в секунду для выбранных рабочих нагрузок.
Rate of Received Packets Dropped: График, показывающий скорость потерянных пакетов при получении в секунду для выбранных рабочих нагрузок.
Rate of Transmitted Packets Dropped: График, показывающий скорость потерянных пакетов при передаче в секунду для выбранных рабочих нагрузок.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
namespace: Позволяет выбрать неймспейс в кластере, для которого будут отображаться метрики.
workload: Позволяет выбрать конкретную загрузку по рабочим нагрузкам внутри указанного неймспейса.
type: Позволяет выбрать тип нагрузки, чтобы фильтровать метрики по конкретным рабочим нагрузкам.

Kubernetes/Persistent Volumes

Дашборд предназначен для мониторинга использования ресурсов постоянных томов в среде Kubernetes. Он позволяет отслеживать параметры, такие как объем занятой и свободной памяти, а также использование inode-томов. Этот инструмент полезен для администраторов системы и DevOps-специалистов, обеспечивая возможность контролировать состояние хранения данных и предотвращать возможные проблемы с нехваткой ресурсов.

Скриншот

Структура дашборда

Использование пространства томов: График, показывающий объем занятой и свободной памяти постоянных томов. Метрики вычисляются с использованием запросов к Kubelet, позволяя анализировать актуальное состояние использования хранилища.
Использование пространства томов: Отображает текущее значение процента использования памяти постоянных томов. Данная панель предоставляет быстрое понимание загруженности хранилища.
Использование inode-томов:График, показывающий количество использованных inode на постоянных томах. Это важно для понимания того, насколько эффективно используются метаданные при работе с файловой системой.
Использование inode-томов: Отображает процент использованных inode, позволяющий быстро определить текущее состояние inode-ресурса.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.
volume: Даёт возможность выбрать конкретный PersistentVolumeClaim для детального анализа его состояния.

Kubernetes/Compute Resources/Cluster

Дашборд предназначен для мониторинга ресурсов вычислений в кластере Kubernetes. Он предоставляет пользователям возможность отслеживать использование CPU и памяти, запрашиваемые и лимитированные ресурсы, а также сетевую активность и I/O операции контейнеров. С помощью этого дашборда администраторы могут быстро оценить состояние кластера, выявить узкие места в ресурсах и оптимизировать распределение нагрузки.

Скриншот

Структура дашборда

CPU Utilisation: Отображает коэффициент использования CPU на протяжении времени для выбранного кластера.
CPU Requests Commitment: Показывает соотношение запрашиваемых ресурсов CPU к общему количеству доступных ресурсов.
CPU Limits Commitment: демонстрирует соотношение лимитов ресурсов CPU к общему количеству доступных ресурсов.
Memory Utilisation: Отображает процент использованной памяти по сравнению с общей доступной памятью в кластере.
Memory Requests Commitment: Показывает соотношение запрашиваемых ресурсов памяти к общему количеству доступных ресурсов.
Memory Limits Commitment: Демонстрирует соотношение лимитов ресурсов памяти к общему количеству доступных ресурсов.
CPU Usage: Отображает использование CPU по неймспейсу в виде временного графика.
CPU Quota: Таблица, которая отображает данные о владельцах подов, количестве подов, использующем CPU, запрашиваемых ресурсах CPU и соотношении использования к лимитам по неймспейсам.
Memory: Отображает использование памяти контейнерами по неймспейсам в виде временного графика.
Memory Requests by Namespace: Таблица, отображающая информацию о владении подами, использовании памяти и запрашиваемых ресурсах по неймспейсам.
Current Network Usage: Таблица, которая показывает текущую сетевую загрузку, включая количество переданных и полученных байтов и пакетов, а также количество потерянных пакетов по неймспейсам.
Receive Bandwidth: Отображает временной график входящей полосы пропускания для контейнеров по неймспейсам.
Transmit Bandwidth: Отображает временной график исходящей полосы пропускания для контейнеров по неймспейсам.
Average Container Bandwidth by Namespace: Received: Временной график, показывающий среднюю входящую полосу пропускания контейнеров по неймспейсам.
Average Container Bandwidth by Namespace: Transmitted: Временной график, демонстрирующий среднюю исходящую полосу пропускания контейнеров по неймспейсам.
Rate of Received Packets: Временной график, отображающий скорость потока пакетов, полученных контейнерами по неймспейсам.
Rate of Transmitted Packets: Временной график, показывающий скорость потока пакетов, отправленных контейнерами по неймспейсам.
Rate of Received Packets Dropped: Временной график, отображающий скорость потерянных пакетов, полученных контейнерами по неймспейсам.
Rate of Transmitted Packets Dropped: Временной график, показывающий скорость потерянных пакетов, отправленных контейнерами по неймспейсам.
IOPS(Reads+Writes): Временной график, показывающий количество операций ввода-вывода в секунду (чтения и записи) по неймспейсам.
ThroughPut(Read+Write): Временной график, отображающий объем данных, прочитанных и записанных с контейнерами, по неймспейсам.
Current Storage IO: Таблица, показывающая характеристики I/O контейнеров, включая чтения и записи данных, по неймспейсам

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
cluster: Позволяет выбирать кластер, для которого будут отображаться метрики, извлекая информацию из параметров метрик Kubernetes.

Kubernetes/Compute Resources/Namespace (Pods)

Дашборд предоставляет комплексный мониторинг ресурсов вычислений в Kubernetes-кластере на уровне неймспейса. Он позволяет отслеживать использование CPU и памяти, а также сетевую и дисковую активность контейнеров. Используя метрики от kube-state-metrics и kubelet, дашборд предлагает пользователю возможность визуализировать ключевые показатели производительности, выявлять узкие места и оптимизировать ресурсы в реальном времени.

Скриншот

Структура дашборда

CPU Utilisation (from requests): Отображает использование CPU в процентах на основании запрашиваемых ресурсов.
CPU Utilisation (from limits): Показывает использование CPU в процентах на основании установленных лимитов.
Memory Utilisation (from requests): Выводит использование памяти на основании запрашиваемых ресурсов.
Memory Utilisation (from limits): Отображает использование памяти на основании установленных лимитов.
CPU Usage: Стремится визуализировать общее использование CPU для каждого пода, а также сравнивает с квотами на ресурсы.
CPU Quota: Таблица, показывающая использование CPU по подам и их квоты на ресурс, как по запросам, так и по лимитам.
Memory Usage (w/o cache): Визуализирует использование памяти без учета кэша на уровне подов.
Memory Quota: Таблица, показывающая использование памяти и квоты на ресурс для каждого пода.
Current Network Usage: Таблица, отображающая текущую сетевую активность, включая количество полученных и переданных байтов и пакетов.
Receive Bandwidth: График, показывающий количество полученных байтов по подам.
Transmit Bandwidth: График, отображающий количество переданных байтов по подам.
Rate of Received Packets: Визуализация скорости полученных пакетов по подам.
Rate of Transmitted Packets: Визуализация скорости переданных пакетов по подам.
Rate of Received Packets Dropped: График, отображающий скорость потерянных пакетов при получении.
Rate of Transmitted Packets Dropped: График, показывающий скорость потерянных пакетов при передаче.
IOPS(Reads+Writes): Визуализирует количество операций чтения и записи на уровне подов.
ThroughPut(Read+Write): Отображает пропускную способность чтения и записи для подов.
Current Storage IO: Таблица, показывающая текущие операции ввода-вывода для контейнеров по подам.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
cluster: Позволяет пользователю выбрать конкретный кластер для мониторинга, извлекая значения меток с помощью запроса.
namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.

Kubernetes/Compute Resources/Namespace (Workloads)

Дашборд предназначен для мониторинга ресурсов вычислений в кластере Kubernetes на уровне неймспейса. Он предоставляет пользователям возможность отслеживать использование CPU и памяти, а также сетевую активность контейнеров внутри рабочих нагрузок. С помощью данного дашборда можно эффективно управлять ресурсами, выявлять перегрузки и оптимизировать распределение нагрузки на кластер.

Скриншот

Структура дашборда

CPU Usage: Отображает временной график использования CPU контейнерами в выбранном неймспейсе и рабочей нагрузке.
CPU Quota: Таблица, показывающая информацию о квотах CPU на уровне рабочих нагрузок, включая полное использование и запрашиваемые ресурсы.
Memory Usage: Отображает временной график использования памяти контейнерами в выбранном неймспейсе и рабочей нагрузке.
Memory Quota: Таблица, показывающая информацию о квотах памяти на уровне рабочих нагрузок, включая полное использование и запрашиваемые ресурсы.
Current Network Usage: Таблица, представляющая текущую сетевую активность для выбранных контейнеров, включая полученные и переданные байты, пакеты и их потери.
Receive Bandwidth: Временной график, отображающий скорость получения сетевых данных на уровне рабочих нагрузок.
Transmit Bandwidth: Временной график, отображающий скорость передачи сетевых данных на уровне рабочих нагрузок.
Average Container Bandwidth by Workload: Received: Временной график, показывающий среднюю скорость получения данных контейнерами по рабочей нагрузке.
Average Container Bandwidth by Workload: Transmitted: Временной график, показывающий среднюю скорость передачи данных контейнерами по рабочей нагрузке.
Rate of Received Packets: Временной график, отображающий скорость получения сетевых пакетов.
Rate of Transmitted Packets: Временной график, отображающий скорость передачи сетевых пакетов.
Rate of Received Packets Dropped: Временной график, показывающий скорость потерь полученных пакетов.
Rate of Transmitted Packets Dropped: Временной график, показывающий скорость потерь переданных пакетов.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.
type: Позволяет выбрать тип рабочей нагрузки (workload) для более детального анализа метрик.

Kubernetes/Compute Resources/Node (Pods)

Дашборд предназначен для мониторинга ресурсов вычислительных узлов в кластере Kubernetes. Он предоставляет важную информацию о потреблении ресурсов, таких как CPU и память, а также их квотах для отдельных подов. Пользователи могут быстро оценить текущее состояние узлов, контролируя максимальные доступные мощности и использование ресурсов, что является ключевым аспектом для обеспечения высокой производительности и стабильности приложений в контейнерах.

Скриншот

Структура дашборда

CPU Usage: Отображает динамику использования CPU в подах, показывая как текущую загрузку, так и максимальную доступную мощность для заданного узла.
CPU Quota: Таблица, отображающая квоты по CPU для подов, включая текущее использование, запрошенные ресурсы и лимиты.
Memory Usage (w/o cache): Отображает использование памяти подами без учета кэша, а также максимальную доступную память для узла.
Memory Quota: Таблица, которая отображает использование памяти подами, запросы и лимиты на память, а также разбиение по RSS, кэшам и свопам для более глубокого анализа.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для мониторинга, в данном случае используется VM Agent.
node: Параметр для выбора узла в кластере, что также помогает в детальном анализе ресурсов на уровне узлов.

Kubernetes/Compute Resources/Pod

Дашборд предназначен для мониторинга ресурсов контейнеров в среде Kubernetes. Он предоставляет пользователям возможность отслеживать использование CPU и памяти, сетевые показатели, а также ввод-вывод операций на дисках. С помощью этого дашборда администраторы и разработчики могут быстро выявлять проблемы с производительностью и оптимизировать распределение ресурсов.

Скриншот

Структура дашборда

CPU Usage: Отображает использование CPU в контейнерах выбранного пода на основе показателей, полученных из VM Agent.
CPU Throttling: Показывает throttling CPU, что позволяет отслеживать ограничения на использование CPU.
CPU Quota: Таблица, отображающая текущие лимиты и запросы на использование CPU.
Memory Usage (WSS): Отображает использование рабочей памяти в контейнерах выбранного пода.
Memory Quota: Таблица, показывающая лимиты и запросы на использование памяти для контейнеров.
Receive Bandwidth: Отображает данные о входящей полосе пропускания для контейнеров.
Transmit Bandwidth: Показывает данные о исходящей полосе пропускания для контейнеров.
Rate of Received Packets: Отображает скорость получения пакетов.
Rate of Transmitted Packets: Отображает скорость отправки пакетов.
Rate of Received Packets Dropped: Показывает скорость получения потерянных пакетов.
Rate of Transmitted Packets Dropped: Отображает скорость отправки потерянных пакетов.
IOPS (Pod): Отображает количество операций ввода-вывода в секунду (IOPS) для пода.
ThroughPut (Pod): Показывает скорость передачи данных (ThroughPut) для пода.
IOPS (Containers): Отображает количество операций ввода-вывода в секунду (IOPS) для контейнеров.
ThroughPut (Containers): Показывает скорость передачи данных (ThroughPut) для контейнеров.
Current Storage IO: Таблица, показывающая текущие операции ввода и вывода для контейнеров, включая количество прочитанных и записанных байтов.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.
pod: Позволяет выбрать один под для мониторинга или все поды на выбранном кластере.

Kubernetes/Compute Resources/Workload

Дашборд предназначен для мониторинга ресурсов вычислительной среды Kubernetes. Он предоставляет детальную информацию о нагрузках на CPU, памяти и сетевых интерфейсах, а также о квотах, выделенных под эти ресурсы. С помощью визуализации временных графиков и таблиц в реальном времени можно отслеживать производительность и эффективность использования ресурсов для различных workloads в кластере.

Скриншот

Структура дашборда

CPU Usage: Отображает использование CPU для каждого пода с помощью временных графиков.
CPU Quota: Таблица, отображающая информацию о квоте CPU, выделенной для подов в виде таблицы на основе различных метрик.
Memory Usage: Презентует текущее использование памяти подами в формате временных графиков.
Memory Quota: Демонстрирует квоты на использование памяти для подов с подробной информацией в виде таблицы.
Current Network Usage: Отображает текущую сетевую активность подов с помощью таблицы, включая как входящий, так и исходящий трафик.
Receive Bandwidth: Временной график, показывающий объем входящей сетевой активности для подов.
Transmit Bandwidth: Временной график, показывающий объем исходящей сетевой активности для подов.
Average Container Bandwidth by Pod: Received: Среднее значение входящего трафика по подам в формате временных графиков.
Average Container Bandwidth by Pod: Transmitted: Среднее значение исходящего трафика по подам в формате временных графиков.
Rate of Received Packets: Временной график, отображающий среднюю скорость получаемых сетевых пакетов.
Rate of Transmitted Packets: Временной график, отображающий среднюю скорость отправляемых сетевых пакетов.
Rate of Received Packets Dropped: Временной график, показывающий количество потерянных входящих пакетов.
Rate of Transmitted Packets Dropped: Временной график, показывающий количество потерянных исходящих пакетов.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
cluster: Позволяет выбрать конкретный кластер Kubernetes для мониторинга.
namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.
type: Позволяет выбрать тип workload для отображаемых метрик.
workload: Позволяет выбрать конкретный workload в заданном неймспейсе и кластере.

Kubernetes/Планировщик

Дашборд предназначен для мониторинга работы планировщика Kubernetes. Он позволяет отслеживать ключевые метрики, связанные с процессом планирования, включая количество активных планировщиков, задержки при планировании и статистику HTTP-запросов к API Kube. Дашборд предоставляет графическую визуализацию данных, что помогает в быстром выявлении и решении проблем с производительностью в кластере Kubernetes.

Скриншот

Структура дашборда

Запущено: Отображает количество запущенных планировщиков в кластере.
Интенсивность планирования: График, показывающий длительность различных стадий планирования в операциях в секунду.
Задержка при планировании (99-й квартиль): График, показывающий99-й квартиль времени задержки при планировании для различных стадий планирования, таких как e2e, binding, scheduling algorithm и volume.
Интенсивность запросов Kube API: График, показывающий количество HTTP-запросов, разделённых по коду статуса, методу и хосту.
Задержка POST-запроса (99-й квартиль): График, показывающий 99-й квартиль задержки POST-запроса в секундах, сгруппированный по методам и URL.
Задержка при GET-запросе (99-й квартиль): График, показывающий 99-й квартиль задержки GET-запроса в секундах, сгруппированный по методам и URL.
Память: График, показывающий объём памяти, используемой планировщиком, в байтах.
Использование ЦП: График, показывающий процессорное время, затрачиваемое на работающий планировщик.
Go-рутины: График, показывающий число GO-рутин, используемых планировщиком.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
service: Позволяет выбрать сервис, для которого будут фильтроваться метрики, или выбрать все сервисы (All) кластера.

Kubernetes/StatefulSet

Дашборд предназначен для мониторинга состояния StatefulSet в Kubernetes кластере. Он предоставляет наглядные метрики, позволяющие отслеживать использование ресурсов, таких как процессор, память и сетевые взаимодействия, а также показатели, связанные с репликацией StatefulSet. Используя дашборд, пользователи могут эффективно анализировать производительность и состояние приложений, работающих в режиме Stateful.

Скриншот

Структура дашборда

ЦП: Отображает процессорное время, затраченное на работу со стейфул.
Память: Отображает объём памяти, используемый StatefulSet.
Сеть: Отображает количество байт, переданных и отправленных StatefulSet.
Требуется реплик: Отображает максимально возможное число реплик.
Количество реплик этой версии: Отображает максимально доступное количество реплик на данный момент.
Наблюдаемая версия: Отображает номер генерации, наблюдаемую контроллером развертывания.
Генерация метаданных: Отображает номер последовательности, представляющий конкретную генерацию желаемого состояния StatefulSet.
Реплики: Временной график метрик по репликам, включая максимальное, созданное, готовое и обновленное число реплик.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда. (например, VM Agent).
cluster: Позволяет выбрать кластер Kubernetes для мониторинга.
namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.
statefulset: Назначение - выбор конкретного StatefulSet для детального мониторинга.

Kubernetes/Views/Global

Дашборд предназначен для мониторинга Kubernetes кластеров и представляет собой современный “Глобальный обзор”, созданный для kube-VM Agent-stack и использующий последние функции Grafana. Он позволяет пользователям отслеживать ресурсы кластера, такие как использование процессора и памяти, количество узлов, подов и другие метрики, что обеспечивает эффективное управление ресурсами и поддержание стабильной работы приложений.

Скриншот

Структура дашборда

Overview:
- Global CPU Usage: Отображает данные о среднем использовании ЦП в процентовом соотношении, включая метрики по реальному использованию, запросам и лимитам ресурсов.
- Global RAM Usage: Представляет информацию об использовании оперативной памяти, включая реальные данные, запросы и лимиты памяти.
- Nodes: Панель показывает общее количество узлов в кластере.
- Kubernetes Resource Count: Визуализирует количество различных ресурсов Kubernetes, включая неймспейсы, запущенные контейнеры, поды, сервисы и другие.
- Namespaces: Отображает общее количество созданных неймспейсов в кластере.
- CPU Usage: Информирует о текущем использовании ЦП в кластере, включая реальные данные, запросы, лимиты и общее количество ядер ЦП.
- RAM Usage: Показатели использования оперативной памяти, включая реальные данные, запросы и лимиты, а также общее количество доступной памяти.
- Running Pods: Отображает текущее количество запущенных подов.
Resources:
- Cluster CPU Utilization: График, показывающий среднее использование ЦП на кластер в процентах.
- Cluster Memory Utilization: Выводит процентное использование оперативной памяти кластера.
- CPU Utilization by namespace: Оценка использования ЦП по отдельным неймспейсам.
- Memory Utilization by namespace: Отображает использование оперативной памяти по неймспейсам.
- CPU Utilization by node: График средних показателей использования ЦП для каждого узла.
- Memory Utilization by node: Визуализация использования оперативной памяти по узлам.
- CPU Throttled seconds by namespace: Отображает информацию о времени простоя ЦП по неймспейсам.
- CPU Core Throttled by node: Панель показывает, сколько времени ядра ЦП находились в состоянии ограничения.
Kubernetes:
- Kubernetes Pods QoS classes: Отображает количество подов по классам качества обслуживания (QoS).
- Kubernetes Pods Status Reason: Информирует о причинах статусов подов.
- OOM Events by namespace: Отображает количество событий завершения работы из-за недостатка памяти по неймспейсам.
- Container Restarts by namespace: Информирует о количестве перезапусков контейнеров по неймспейсам.
Network:
- Global Network Utilization by device: Отражает загрузку сети по устройствам, исключая виртуальные устройства.
- Network Saturation - Packets dropped: Показывает количество потерянных пакетов при получении и отправке данных.
- Network Received by namespace: Отображает получение и передачу данных по неймспейсам.
- Total Network Received (with all virtual devices) by node: Информация о полученных и переданных данных по узлам, включая все виртуальные устройства.
- Network Received (without loopback) by node: Показывает сетевую активность по узлам без учета петлевых устройств.
- Network Received (loopback only) by node: Визуализация сетевой активности только по петлевым устройствам на узлах.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
role: Позволяет пользователю выбрать роль узлов для фильтрации метрик.
node: Предоставляет возможность фильтровать метрики по конкретному узлу.
resolution: Позволяет пользователю выбрать временное разрешение для отображаемых данных (1s, 15s, 30s, 1m, 3m, 5m).

Kubernetes/System/CoreDNS

Дашборд представляет собой решение для мониторинга CoreDNS в кластерах Kubernetes. Он создан для использования совместно с kube-prometheus-stack и реализует последние функции Grafana. Дашборд позволяет отслеживать различные метрики, связанные с работой CoreDNS, включая статус здоровья, использование ресурсов, статистику DNS-запросов и кэширования.

Скриншот

Структура дашборда

CoreDNS - Health Status: Отображает состояние здоровья экземпляров CoreDNS, проверяя доступность сервиса через метрику up.
CoreDNS - CPU Usage by instance: Показывает использование процессора по каждому экземпляру CoreDNS, используя метрику process_cpu_seconds_total.
CoreDNS - Memory Usage by instance: Демонстрирует использование памяти по экземплярам CoreDNS, основываясь на метрике process_resident_memory_bytes.
CoreDNS - Total DNS Requests ($protocol): Отображает общее количество DNS-запросов за определенный период, с возможностью фильтрации по протоколу.
CoreDNS - Average Packet Size ($protocol): Предоставляет данные о средней величине пакета DNS-запроса, сгруппированные по протоколам.
CoreDNS - Requests by type: Позволяет увидеть количество DNS-запросов, разделенных по типам (A, AAAA, CNAME и т.д.).
CoreDNS - Requests by return code: Показывает, сколько запросов было выполнено с различными кодами возврата (например, SUCCESS, SERVFAIL).
CoreDNS - Total Forward Requests: Отображает общее количество запросов, перенаправленных на другие DNS-серверы. Не используется
CoreDNS - DNS Errors: Информирует о количестве ошибок DNS (например, SERVFAIL и REFUSED), возникающих во время операций. Не используется
CoreDNS - Cache Hits / Misses: Предоставляет метрики кэширования, показывающие количество попаданий и промахов при использовании кэша DNS.
CoreDNS - Cache Size: Отображает размер кэша DNS, агрегируя данные по типам.
CoreDNS - DNS request duration: Отображает тепловую карту времени обработки DNS-запросов.
CoreDNS - DNS request size: Представляет размеры DNS-запросов в виде тепловой карты.
CoreDNS - DNS response size: Показывает размеры DNS-ответов в виде тепловой карты.

Настраиваемые параметры

datasource: Позволяет выбрать источник данных для настройки дашборда.
cluster: Позволяет выбрать кластер Kubernetes для мониторинга. Переменная запрашивает уникальные значения метки cluster из метрики kube_node_info.
instance: Позволяет фильтровать мониторинг по экземплярам CoreDNS, основанным на состоянии работы. Эта переменная включает все доступные экземпляры для выбора.
protocol: Позволяет выбрать протокол для отображения метрик DNS-запросов (например, UDP или TCP).
resolution: ППозволяет выбрать разрешение данных для отображения метрик, с доступными значениями от 1 секунды до 5 минут.
job: Позволяет выбрать заданиt (jobs), чтобы фильтровать метрики CoreDNS по различным задачам.

Kubernetes

Kubernetes/API-сервер #

Kubernetes/Controller Manager #

Kubernetes/ETCD Cluster Health #

Kubernetes/Ingress #

Kubernetes/Кубелет #

Kubernetes/Networking/Cluster #

Kubernetes/Networking/Namespace (Pods) #

Kubernetes/Networking/Namespace (Workload) #

Kubernetes/Networking/Pod #

Kubernetes/Networking/Workload #

Kubernetes/Persistent Volumes #

Kubernetes/Compute Resources/Cluster #

Kubernetes/Compute Resources/Namespace (Pods) #

Kubernetes/Compute Resources/Namespace (Workloads) #

Kubernetes/Compute Resources/Node (Pods) #

Kubernetes/Compute Resources/Pod #

Kubernetes/Compute Resources/Workload #

Kubernetes/Планировщик #

Kubernetes/StatefulSet #

Kubernetes/Views/Global #

Kubernetes/System/CoreDNS #

Kubernetes/API-сервер

Kubernetes/Controller Manager

Kubernetes/ETCD Cluster Health

Kubernetes/Ingress

Kubernetes/Кубелет

Kubernetes/Networking/Cluster

Kubernetes/Networking/Namespace (Pods)

Kubernetes/Networking/Namespace (Workload)

Kubernetes/Networking/Pod

Kubernetes/Networking/Workload

Kubernetes/Persistent Volumes

Kubernetes/Compute Resources/Cluster

Kubernetes/Compute Resources/Namespace (Pods)

Kubernetes/Compute Resources/Namespace (Workloads)

Kubernetes/Compute Resources/Node (Pods)

Kubernetes/Compute Resources/Pod

Kubernetes/Compute Resources/Workload

Kubernetes/Планировщик

Kubernetes/StatefulSet

Kubernetes/Views/Global

Kubernetes/System/CoreDNS