Kubernetes
-
- Kubernetes/API-сервер
- Kubernetes/Controller Manager
- Kubernetes/ETCD Cluster Health
- Kubernetes/Ingress
- Kubernetes/Кубелет
- Kubernetes/Networking/Cluster
- Kubernetes/Networking/Namespace (Pods)
- Kubernetes/Networking/Namespace (Workload)
- Kubernetes/Networking/Pod
- Kubernetes/Networking/Workload
- Kubernetes/Persistent Volumes
- Kubernetes/Compute Resources/Cluster
- Kubernetes/Compute Resources/Namespace (Pods)
- Kubernetes/Compute Resources/Namespace (Workloads)
- Kubernetes/Compute Resources/Node (Pods)
- Kubernetes/Compute Resources/Pod
- Kubernetes/Compute Resources/Workload
- Kubernetes/Планировщик
- Kubernetes/StatefulSet
- Kubernetes/Views/Global
- Kubernetes/System/CoreDNS
На этой странице
-
- Kubernetes/API-сервер
- Kubernetes/Controller Manager
- Kubernetes/ETCD Cluster Health
- Kubernetes/Ingress
- Kubernetes/Кубелет
- Kubernetes/Networking/Cluster
- Kubernetes/Networking/Namespace (Pods)
- Kubernetes/Networking/Namespace (Workload)
- Kubernetes/Networking/Pod
- Kubernetes/Networking/Workload
- Kubernetes/Persistent Volumes
- Kubernetes/Compute Resources/Cluster
- Kubernetes/Compute Resources/Namespace (Pods)
- Kubernetes/Compute Resources/Namespace (Workloads)
- Kubernetes/Compute Resources/Node (Pods)
- Kubernetes/Compute Resources/Pod
- Kubernetes/Compute Resources/Workload
- Kubernetes/Планировщик
- Kubernetes/StatefulSet
- Kubernetes/Views/Global
- Kubernetes/System/CoreDNS
Kubernetes/API-сервер
Дашборд предназначен для мониторинга состояния API-серверов в окружении Kubernetes. Он предоставляет возможности отслеживания доступности и производительности запросов к API, позволяя анализировать как входящие (читающие) так и исходящие (записывающие) операции. С помощью этого инструмента можно оперативно выявлять ошибки и аномалии в работе сервисов, что критически важно для обеспечения устойчивости и надежности приложений.
Скриншот

Структура дашборда
- Доступность (30d) > 99.000%: Отображает процент успешных запросов к API за последние 30 дней.
- Запас ошибок (30d) > 99.000%: График, показывающий запас по ошибкам, остающимся при гарантии доступности 0,990%.
- Доступность чтения (30d): Отображает процент успешных запросов на чтение (LIST, GET) за последние 30 дней.
- Чтение SLI - Запросы: График, показывающий количество запросов на чтение (LIST, GET) в секунду по кодам ответов.
- Чтение SLI - Ошибки: График, отображающий процент ошибок (5xx) среди запросов на чтение.
- Чтение SLI - Продолжительность: График, показывающий 99-й процентиль времени выполнения запросов на чтение. SLI метрики только на Control Plane /за более продолжительный срок
- Доступность записи (30d): Отображает процент успешных запросов на запись (POST, PUT, PATCH,DELETE) за последние 30 дней.
- Запись SLI - Запросы: График, показывающий количество запросов на запись в секунду по кодам ответов.
- Запись SLI - Ошибки: График, показывающий процент ошибок (5xx) среди запросов на запись.
- Запись SLI - Продолжительность: График, показывающий 99-й процентиль времени выполнения запросов на запись. SLI метрики только на Control Plane /за более продолжительный срок
- Скорость добавления в рабочую очередь: График, отображающий общее количество добавлений в рабочую очередь в секунду.
- Глубина рабочей очереди: График, показывающий количество операций ввода-вывода,обрабатываемых одновременно в очереди.
- Задержка в рабочей очереди: График, показывающий, сколько времени в секундах элемент остается в очереди перед обработкой.
- Использование памяти: График, отображающий объем используемой памяти (в байтах) для API-серверов.
- Использование ЦП: График, показывающий, какое время процесс использовал в последнюю единицу времени.
- Go-рутины: График, отображающий количество активных Go-рутинов.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных, используемый для отображения метрик.
- service: Позволяет выбрать сервис, для которого будут фильтроваться метрики, или выбрать все сервисы (All) кластера.
Kubernetes/Controller Manager
Дашборд предназначен для мониторинга Kubernetes Controller Manager и предоставляет пользователям возможность отслеживать состояние и производительность компонентов системы. С его помощью можно наблюдать важные метрики, такие как количество запущенных процессов, интенсивность добавлений в рабочую очередь, задержки запросов Kube API и использование системных ресурсов. Период обновления данных составляет 10 секунд, что позволяет получать актуальную информацию о работе кластеров в режиме реального времени.
Скриншот

Структура дашборда
- Запущено: Отображает общее количество запущенных экземпляров Kube Controller Manager на выбранном кластере.
- Интенсивность добавления в рабочую очередь: График, показывающий суммарное количество добавлений в рабочую очередь с разбивкой по кластеру и подам.
- Глубина рабочей очереди: График, отображающий количество операций ввода-вывода, которые могут одновременно обрабатываться системой.
- Задержка рабочей очереди: График, который показывает время, в течение которого элемент остается в рабочей очереди перед его обработкой.
- Интенсивность запросов Kube API: График, который отображает общее количество клиентских запросов к Kube API с разбивкой по коду ответа.
- Задержка GET-запросов (99-й квантиль): График, показывающий задержку GET-запросов в секундах, с разбивкой по типу запроса и URL.
- Задержка POST-запросов (99-й квантиль): График, отображающий задержку POST-запросов в секундах с разбивкой по типу запроса и URL.
- Использование памяти: График, показывающий объем используемой памяти (в байтах) для каждого пода Kube Controller Manager.
- Использование ЦП: График, отображающий процессорное время, использованное последним объектом каждого пода за единицу времени.
- Go-рутины: График, показывающий количество активных Go-рутин в каждом поде.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- pod: Позволяет выбрать один под для мониторинга или все поды на выбранном кластере.
Kubernetes/ETCD Cluster Health
Дашборд предназначен для мониторинга здоровья кластера ETCD в окружении Kubernetes. Он интегрирован с системой сбора метрик VM Agent и предоставляет подробную информацию о работе ETCD, включая статус лидерства, количество изменений лидеров, размер базы данных, пропускную способность и различные метрики производительности. Пользователи могут отслеживать ключевые показатели эффективности и настраивать оповещения для повышения надежности и стабильности кластера.
Скриншот

Структура дашборда
-
ETCD Cluster View:
- Etcd has a leader?: Отображает информацию о наличии лидера в кластере ETCD.
- The total number of failed proposals seen: Показывает общее количество неудачных предложений в кластере.
- DB Size: График, отображающий оценку общего размера базы данных, представлена как граф и статистика.
- The number of leader changes seen: Количество изменений лидеров в кластере.
- ETCD rps: Показывает количество запросов в секунду к ETCD.
- RPS Successful Rate: График, отображающий успешные запросы в секунду, представлены как граф и статистика.
- Members State: Таблица состояния членов кластера, показывает, кто из них является лидером.
- RPS Failed Rate: График, отображающий невыполненные запросы в секунду, представлены как граф и статистика.
-
Detailed:
- Memory: График, отображающий использование памяти процессом пода ETCD.
- RPS Failed Rate: График неудачных запросов в секунду по подам.
- Disk Sync Duration: График, отображающий продолжительность синхронизации на диске, представлена как график с 99-ым процентилем.
- Disk Compact Duration: График, показывающий время сжатия на диске, показано дважды; один из графиков - с 99-ым процентилем.
- Heartbeat Failures: График, показывающий количество сбоев отправки heartbeat.
- Raft Proposals: График, показывающий общие метрики предложений Raft, включая уровень успешных и неудачных предложений.
- Proposals pending: График, показывающий количество ожидающих предложений.
- The total number of consensus proposals committed: Общее количество предложений, согласованных в кластере.
- Client Traffic In: График входящего трафика от клиентов.
- Client Traffic Out: График исходящего трафика к клиентам.
- Total Leader Elections Per Day: График, показывающий общее количество выборов лидеров в день.
- Peer Traffic In: График, показывающий входящий трафик между узлами кластера.
- Peer Traffic Out: График, показывающий исходящий трафик между узлами кластера.
- Disks operations: График операций с дисками.
- Network: Графики общего трафика клиентов, как входящего, так и исходящего.
- Snapshot duration: График, показывающий длительность снимков, устанавливает возможные проблемы с диском.
-
Alerts:
- ETCD disk io latency alerts: График, показывающий оповещения по задержкам ввода-вывода на диске ETCD.
- alert if 99th percentile of round trips take 150ms: График, показывающий оповещения при превышении 150 мс для 99-го процентиля времени обратного движения.
- ETCD Status: График, показывающий статус системы ETCD, показывает общий статус подов.
- ETCD Leader Changes Alert: График, показывающий предупреждения об изменениях лидера в кластере.
- Disk Compact Duration: График, показывающий оповещения по времени сжатия на диске.
- Disk Sync Duration: График, показывающий оповещения по времени синхронизации на диске.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
Kubernetes/Ingress
Дашборд предназначен для мониторинга операторов NGINX Ingress в Kubernetes. Он позволяет пользователям отслеживать различные метрики, такие как объем запросов, коэффициенты успешности, нагрузки на сеть и использование ресурсов, а также осуществлять аналитику производительности Ingress-контроллеров. Благодаря графическому представлению данных и настраиваемым параметрам, пользователи могут легко отслеживать состояние своих приложений и выявлять потенциальные проблемы с производительностью.
Скриншот

Структура дашборда
- Controller Request Volume: Отображает объем запросов, обработанных контроллером Ingress.
- Controller Connections: Показывает количество активных соединений контроллера NGINX.
- Controller Success Rate (non-4|5xx responses): График, отображающий процент успешных ответов(коды ответов не 4xx и не 5xx).
- Config Reloads: Отображает частоту перезагрузки конфигурации контроллера.
- Last Config Failed: Отображает количество неудачных попыток перезагрузки последней конфигурации.
- Ingress Request Volume: Временной график, показывающий объем запросов к определенному Ingress.
- Ingress Success Rate (non-4|5xx responses): Процент успешных ответов для конкретного Ingress.
- Network I/O pressure: Графики, показывающие входящее и исходящее сетевое давление.
- Average Memory Usage: График, показывающий среднее значение потребляемой памяти контроллером NGINX.
- Average CPU Usage: График, показывающий среднее значение загрузки ЦП контроллером NGINX.
- Ingress Percentile Response Times and Transfer Rates: Таблица, отображающая процентильные времена ответа и объем передаваемых данных для Ingress.
- Ingress Percentile Response Times (Ingress Namespaces): Временные ряды процентов по времени ответа для различных Ingress.
- Ingress Request Latency Heatmap (Ingress Namespaces): Тепловая карта, показывающая задержку по запросам для Ingress.
- Ingress Certificate Expiry: Таблица с информацией о времени истечения сертификатов для Ingress.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- namespace: Позволяет выбрать неймспейса, в котором работает контроллер Ingress.
- controller_class: Позволяет выбрать класс контроллера для фильтрации метрик.
- controller: Позволяет выбрать под контроллера для отслеживания метрик.
- exported_namespace: Позволяет выбрать неймспейс Ingress для анализа запросов.
- ingress: Позволяет выбрать конкретный Ingress для мониторинга его метрик.
Kubernetes/Кубелет
Дашборд предназначен для мониторинга состояния кластеров Kubernetes с использованием данных, получаемых через Kubelet. Он отображает ключевые метрики, такие как количество запущенных контейнеров, подов, а также время выполнения операций, что позволяет администраторам и DevOps-командам эффективно управлять ресурсами и реагировать на потенциальные проблемы.
Скриншот

Структура дашборда
- Запущенные Kubelet: Отображает суммарное количество всех запущенных Kubelet.
- Запущенные поды: Отображает суммарное количество всех запущенных подов с разделением по узлам.
- Запущенные контейнеры: Отображает суммарное количество всех запущенных контейнеров с разделением по узлам.
- Фактическое кол-во томов: Отображает суммарное количество всех используемых томов.
- Требуемое количество томов: Отображает суммарное количество необходимых для исправной работы томов.
- Кол-во конфиг. ошибок: Отображает суммарное количество конфигурационных ошибок Kubelet.
- Интенсивность работы (оп./с): График, отображающий количество операций в секунду по выполнению операций различных типов.
- Интенсивность нарушений работы (оп./с): График, отображающий количество операций в секунду, затраченных на отдельные задачами Kubelet.
- Длительность работы (99-й квантиль): График, отображающий 99-й квантиль количества операций в секунду некорректной работы Kubelet.
- Интенсивность запуска подов (оп./с): График, отображающий время, затрачиваемое на запуск подов с разделением по узлам.
- Длительность запуска подов (99-й квантиль): График, отображающий 99-й квантиль длительности запуска подов.
- Интенсивность работы хранилища (оп./с): График, отображающий количество операций в секунду, затраченных на выполнение операций с хранилищами.
- Интенсивность нарушений работы хранилища (оп./с): График, отображающий количество операций в секунду некорректной работы хранилища.
- Продолжительность работы хранилища (99-й квантиль): График, отображающий 99-й квантиль времени выполнения операций с хранилищем.
- Интенсивность обновления PLEG (оп./с): Количество операций в секунду, выполняемых генератором событий PLEG.
- Период обновления списка PLEG (99-й квантиль): График, отображающий 99-й квантиль времени обновления списка PLEG.
- Продолжительность обновления списка PLEG (99-й квантиль): График, отображающий 99-й квантиль времени обновления списка PLEG.
- Интенсивность удаленных вызовов (RPC): График, отображающий суммарное количество удаленных клиентских запросов в секунду, распределенных по кодам ответа.
- Длительность запросов (99-й квантиль): График, отображающий 99-й квантиль продолжительности запросов к API.
- Память: График, отображающий объем памяти, использованной Kubelet.
- Использование ЦП: График, отображающий процессорное время, затраченное Kubelet.
- Go-рутины: График, отображающий количество горутин, используемых Kubelet.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- node: Позволяет выбрать узел для мониторинга. Доступные узлы берутся из данных кластера.
Kubernetes/Networking/Cluster
Дашборд предназначен для мониторинга сетевой активности кластеров Kubernetes. Он предоставляет детальную информацию о передаче и получении данных, а также о состоянии сети в рамках кластеров. С помощью этого дашборда пользователи могут отслеживать ключевые метрики, такие как скорость передачи байтов, количество переданных и полученных пакетов, а также количество потерянных пакетов, что является важной частью обеспечения стабильности и производительности приложений, работающих в контейнерах.
Скриншот

Структура дашборда
- Current Rate of Bytes Received: График, показывающий текущую скорость получения байтов по неймспейсу в кластере.
- Current Rate of Bytes Transmitted:График, показывающий текущую скорость передачи байтов по неймспейсу.
- Current Status: Таблица, в которой отображаются текущие метрики по полученным и переданным байтам, средние значения, а также количество принятых и переданных пакетов и число потерянных пакетов.
- Average Rate of Bytes Received: График, показывающий среднюю скорость получения байтов по неймспейсу.
- Average Rate of Bytes Transmitted: График, показывающий среднюю скорость передачи байтов по неймспейсу.
- Receive Bandwidth:График, показывающий полосу пропускания для получения трафика по неймспейсу.
- Transmit Bandwidth: График, показывающий полосу пропускания для передачи трафика по неймспейсу.
- Rate of Received Packets: График, показывающий скорость получения пакетов по неймспейсу.
- Rate of Transmitted Packets: График, показывающий скорость передачи пакетов по неймспейсу.
- Rate of Received Packets Dropped: График, показывающий скорость потерянных пакетов при получении по неймспейсу.
- Rate of Transmitted Packets Dropped: График, показывающий скорость потерянных пакетов припередаче по неймспейсу.
- Rate of TCP Retransmits out of all sent segments: График, показывающий скорость повторной передачи TCP сегментов из всех отправленных сегментов.
- Rate of TCP SYN Retransmits out of all retransmits: График, показывающий скорость повторной передачи TCP SYN из всех повторных передач.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- cluster: Позволяет пользователю выбрать конкретный кластер, данные о котором будут отображаться на дашборде, извлекая значения метки из данных, получаемых от Kubelet.
Kubernetes/Networking/Namespace (Pods)
Дашборд предназначен для мониторинга сетевой активности подов в кластере Kubernetes. Он предоставляет визуализацию различных метрик, связанных с передачей и приемом сетевых данных, а также количеством переданных и потерянных пакетов. Дашборд позволяет администраторам и разработчикам отслеживать состояние сетевой активности в реальном времени, что критически важно для оптимизации производительности приложений и обеспечения стабильности работы контейнеризованных сервисов.
Скриншот

Структура дашборда
- Current Rate of Bytes Received: Панель отображает текущую скорость приема байт от подов в выбранном кластере и неймспейсе.
- Current Rate of Bytes Transmitted: Панель показывает текущую скорость передачи байт от подов.
- Current Network Usage: Таблица, в которой представлены метрики по сетевому использованию для каждого пода, включая скорость получения и передачи байт, скорость получения и передачи пакетов, а также количество потерянных пакетов.
- Receive Bandwidth: Временной графи, отображающий скорость приема байт по подам.
- Transmit Bandwidth: Временной график, показывающий скорость передачи байт по подам.
- Rate of Received Packets: Временной график для мониторинга скорости получения пакетов по подам.
- Rate of Transmitted Packets: Временной график для мониторинга скорости передачи пакетов по подам.
- Rate of Received Packets Dropped: Временной график, показывающий скорость потерь пакетов при получении, сгруппированных по неймспейсу.
- Rate of Transmitted Packets Dropped: Временной график, отображающий скорость потерь пакетов при передаче по подам.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.
Kubernetes/Networking/Namespace (Workload)
Дашборд предназначен для мониторинга сетевой активности контейнеров в окружении Kubernetes. Он предоставляет пользователю возможность отслеживать различные метрики, связанные с получением и передачей данных, а также состоянием сетевых ресурсов на уровне неймспейсов. Дашборд помогает оперативно выявлять проблемы и оптимизировать сетевую производительность путем анализа входящего и исходящего трафика, а также статистики по потерянным пакетам.
Скриншот

Структура дашборда
- Current Rate of Bytes Received: Отображает текущую скорость получения байтов в контейнерах, по различным рабочим нагрузкам.
- Current Rate of Bytes Transmitted: Отображает текущую скорость передачи байтов из контейнеров.
- Current Status: Сводная таблица состояния, показывающая количество полученных и переданных байтов, а также пакетную активность (количество принятых и переданных пакетов).
- Receive Bandwidth: График, отображающий объем полученного трафика в байтах.
- Transmit Bandwidth: График, показывающий объем переданного трафика в байтах.
- Average Container Bandwidth by Workload: Received: Средняя скорость получения данных контейнерами по рабочим нагрузкам.
- Average Container Bandwidth by Workload: Transmitted: Средняя скорость передачи данных контейнерами по рабочим нагрузкам.
- Rate of Received Packets: График, показывающий скорость получения пакетов.
- Rate of Transmitted Packets: График, показывающий скорость передачи пакетов.
- Rate of Received Packets Dropped: График, отображающий скорость потерянных пакетов при получении.
- Rate of Transmitted Packets Dropped: График, отображающий скорость потерянных пакетов при передаче.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для запроса метрик, заданный в формате VM Agent.
- namespace: Позволяет отфильтровать метрики по определенному неймспейсу в кластере.
- type: Позволяет выбрать тип рабочей нагрузки.
Kubernetes/Networking/Pod
Дашборд предназначен для мониторинга сетевых показателей в среде Kubernetes. Он предоставляет пользователю возможность отслеживать текущие параметры сети, такие как скорость получения и передачи данных, а также количество пакетов, полученных и отправленных контейнерами. Дашборд использует данные из VM Agent для визуализации метрик, что позволяет быстро выявлять проблемы с сетью и анализировать производительность приложений.
Скриншот

Структура дашборда
- Current Rate of Bytes Received: Отображает текущую скорость получения байтов по указанному кластеру, неймспейсу и поду.
- Current Rate of Bytes Transmitted: Показывает текущую скорость передачи байтов для заданных параметров.
- Receive Bandwidth: Временной график, отображающий скорость получения данных для каждого пода на протяжении времени.
- Transmit Bandwidth: Временной график, показывающий скорость передачи данных для каждого пода.
- Rate of Received Packets: Временной график, показывающий скорость получения пакетов сети, сгруппированных по подам.
- Rate of Transmitted Packets: Временной график, показывающий скорость передачи пакетов в сети для каждого пода.
- Rate of Received Packets Dropped: Временной график, показывающий скорость потерянных пакетов, полученных по сети, для каждого пода.
- Rate of Transmitted Packets Dropped: Временной график, показывающий скорость потерянных пакетов на уровне передачи для каждого пода.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- namespace: Позволяет выбрать неймспейс, для которого будут отображаться метрики.
- pod: Позволяет выбрать один под для мониторинга или все поды на выбранном кластере.
Kubernetes/Networking/Workload
Дашборд предназначен для мониторинга сетевых показателей в средах Kubernetes. Он предоставляет пользователям возможность отслеживать текущие и средние скорости приема и передачи байтов, а также количество полученных и переданных пакетов. Это особенно полезно для администраторов и разработчиков, ответственных за производительность и надежность приложений, работающих в кластерах Kubernetes. Дашборд освещает критические метрики, которые помогают выявлять узкие места в сетевом взаимодействии рабочих нагрузок.
Скриншот

Структура дашборда
- Current Rate of Bytes Received: Отображает текущую скорость приема байтов в секундах для выбранных рабочих нагрузок.
- Current Rate of Bytes Transmitted: Отображает текущую скорость передачи байтов в секундах для выбранных рабочих нагрузок.
- Average Rate of Bytes Received: Отображает среднюю скорость приема байтов для выбранных рабочих нагрузок.
- Average Rate of Bytes Transmitted: Отображает среднюю скорость передачи байтов для выбранных рабочих нагрузок.
- Receive Bandwidth: График потребляемой полосы пропускания для получаемых байтов.
- Transmit Bandwidth: График потребляемой полосы пропускания для передаваемых байтов.
- Rate of Received Packets: График, показывающий скорость получения пакетов в секунду для выбранных рабочих нагрузок.
- Rate of Transmitted Packets: График, показывающий скорость передачи пакетов в секунду для выбранных рабочих нагрузок.
- Rate of Received Packets Dropped: График, показывающий скорость потерянных пакетов при получении в секунду для выбранных рабочих нагрузок.
- Rate of Transmitted Packets Dropped: График, показывающий скорость потерянных пакетов при передаче в секунду для выбранных рабочих нагрузок.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- namespace: Позволяет выбрать неймспейс в кластере, для которого будут отображаться метрики.
- workload: Позволяет выбрать конкретную загрузку по рабочим нагрузкам внутри указанного неймспейса.
- type: Позволяет выбрать тип нагрузки, чтобы фильтровать метрики по конкретным рабочим нагрузкам.
Kubernetes/Persistent Volumes
Дашборд предназначен для мониторинга использования ресурсов постоянных томов в среде Kubernetes. Он позволяет отслеживать параметры, такие как объем занятой и свободной памяти, а также использование inode-томов. Этот инструмент полезен для администраторов системы и DevOps-специалистов, обеспечивая возможность контролировать состояние хранения данных и предотвращать возможные проблемы с нехваткой ресурсов.
Скриншот

Структура дашборда
- Использование пространства томов: График, показывающий объем занятой и свободной памяти постоянных томов. Метрики вычисляются с использованием запросов к Kubelet, позволяя анализировать актуальное состояние использования хранилища.
- Использование пространства томов: Отображает текущее значение процента использования памяти постоянных томов. Данная панель предоставляет быстрое понимание загруженности хранилища.
- Использование inode-томов:График, показывающий количество использованных inode на постоянных томах. Это важно для понимания того, насколько эффективно используются метаданные при работе с файловой системой.
- Использование inode-томов: Отображает процент использованных inode, позволяющий быстро определить текущее состояние inode-ресурса.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.
- volume: Даёт возможность выбрать конкретный PersistentVolumeClaim для детального анализа его состояния.
Kubernetes/Compute Resources/Cluster
Дашборд предназначен для мониторинга ресурсов вычислений в кластере Kubernetes. Он предоставляет пользователям возможность отслеживать использование CPU и памяти, запрашиваемые и лимитированные ресурсы, а также сетевую активность и I/O операции контейнеров. С помощью этого дашборда администраторы могут быстро оценить состояние кластера, выявить узкие места в ресурсах и оптимизировать распределение нагрузки.
Скриншот

Структура дашборда
- CPU Utilisation: Отображает коэффициент использования CPU на протяжении времени для выбранного кластера.
- CPU Requests Commitment: Показывает соотношение запрашиваемых ресурсов CPU к общему количеству доступных ресурсов.
- CPU Limits Commitment: демонстрирует соотношение лимитов ресурсов CPU к общему количеству доступных ресурсов.
- Memory Utilisation: Отображает процент использованной памяти по сравнению с общей доступной памятью в кластере.
- Memory Requests Commitment: Показывает соотношение запрашиваемых ресурсов памяти к общему количеству доступных ресурсов.
- Memory Limits Commitment: Демонстрирует соотношение лимитов ресурсов памяти к общему количеству доступных ресурсов.
- CPU Usage: Отображает использование CPU по неймспейсу в виде временного графика.
- CPU Quota: Таблица, которая отображает данные о владельцах подов, количестве подов, использующем CPU, запрашиваемых ресурсах CPU и соотношении использования к лимитам по неймспейсам.
- Memory: Отображает использование памяти контейнерами по неймспейсам в виде временного графика.
- Memory Requests by Namespace: Таблица, отображающая информацию о владении подами, использовании памяти и запрашиваемых ресурсах по неймспейсам.
- Current Network Usage: Таблица, которая показывает текущую сетевую загрузку, включая количество переданных и полученных байтов и пакетов, а также количество потерянных пакетов по неймспейсам.
- Receive Bandwidth: Отображает временной график входящей полосы пропускания для контейнеров по неймспейсам.
- Transmit Bandwidth: Отображает временной график исходящей полосы пропускания для контейнеров по неймспейсам.
- Average Container Bandwidth by Namespace: Received: Временной график, показывающий среднюю входящую полосу пропускания контейнеров по неймспейсам.
- Average Container Bandwidth by Namespace: Transmitted: Временной график, демонстрирующий среднюю исходящую полосу пропускания контейнеров по неймспейсам.
- Rate of Received Packets: Временной график, отображающий скорость потока пакетов, полученных контейнерами по неймспейсам.
- Rate of Transmitted Packets: Временной график, показывающий скорость потока пакетов, отправленных контейнерами по неймспейсам.
- Rate of Received Packets Dropped: Временной график, отображающий скорость потерянных пакетов, полученных контейнерами по неймспейсам.
- Rate of Transmitted Packets Dropped: Временной график, показывающий скорость потерянных пакетов, отправленных контейнерами по неймспейсам.
- IOPS(Reads+Writes): Временной график, показывающий количество операций ввода-вывода в секунду (чтения и записи) по неймспейсам.
- ThroughPut(Read+Write): Временной график, отображающий объем данных, прочитанных и записанных с контейнерами, по неймспейсам.
- Current Storage IO: Таблица, показывающая характеристики I/O контейнеров, включая чтения и записи данных, по неймспейсам
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- cluster: Позволяет выбирать кластер, для которого будут отображаться метрики, извлекая информацию из параметров метрик Kubernetes.
Kubernetes/Compute Resources/Namespace (Pods)
Дашборд предоставляет комплексный мониторинг ресурсов вычислений в Kubernetes-кластере на уровне неймспейса. Он позволяет отслеживать использование CPU и памяти, а также сетевую и дисковую активность контейнеров. Используя метрики от kube-state-metrics и kubelet, дашборд предлагает пользователю возможность визуализировать ключевые показатели производительности, выявлять узкие места и оптимизировать ресурсы в реальном времени.
Скриншот

Структура дашборда
- CPU Utilisation (from requests): Отображает использование CPU в процентах на основании запрашиваемых ресурсов.
- CPU Utilisation (from limits): Показывает использование CPU в процентах на основании установленных лимитов.
- Memory Utilisation (from requests): Выводит использование памяти на основании запрашиваемых ресурсов.
- Memory Utilisation (from limits): Отображает использование памяти на основании установленных лимитов.
- CPU Usage: Стремится визуализировать общее использование CPU для каждого пода, а также сравнивает с квотами на ресурсы.
- CPU Quota: Таблица, показывающая использование CPU по подам и их квоты на ресурс, как по запросам, так и по лимитам.
- Memory Usage (w/o cache): Визуализирует использование памяти без учета кэша на уровне подов.
- Memory Quota: Таблица, показывающая использование памяти и квоты на ресурс для каждого пода.
- Current Network Usage: Таблица, отображающая текущую сетевую активность, включая количество полученных и переданных байтов и пакетов.
- Receive Bandwidth: График, показывающий количество полученных байтов по подам.
- Transmit Bandwidth: График, отображающий количество переданных байтов по подам.
- Rate of Received Packets: Визуализация скорости полученных пакетов по подам.
- Rate of Transmitted Packets: Визуализация скорости переданных пакетов по подам.
- Rate of Received Packets Dropped: График, отображающий скорость потерянных пакетов при получении.
- Rate of Transmitted Packets Dropped: График, показывающий скорость потерянных пакетов при передаче.
- IOPS(Reads+Writes): Визуализирует количество операций чтения и записи на уровне подов.
- ThroughPut(Read+Write): Отображает пропускную способность чтения и записи для подов.
- Current Storage IO: Таблица, показывающая текущие операции ввода-вывода для контейнеров по подам.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- cluster: Позволяет пользователю выбрать конкретный кластер для мониторинга, извлекая значения меток с помощью запроса.
- namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.
Kubernetes/Compute Resources/Namespace (Workloads)
Дашборд предназначен для мониторинга ресурсов вычислений в кластере Kubernetes на уровне неймспейса. Он предоставляет пользователям возможность отслеживать использование CPU и памяти, а также сетевую активность контейнеров внутри рабочих нагрузок. С помощью данного дашборда можно эффективно управлять ресурсами, выявлять перегрузки и оптимизировать распределение нагрузки на кластер.
Скриншот

Структура дашборда
- CPU Usage: Отображает временной график использования CPU контейнерами в выбранном неймспейсе и рабочей нагрузке.
- CPU Quota: Таблица, показывающая информацию о квотах CPU на уровне рабочих нагрузок, включая полное использование и запрашиваемые ресурсы.
- Memory Usage: Отображает временной график использования памяти контейнерами в выбранном неймспейсе и рабочей нагрузке.
- Memory Quota: Таблица, показывающая информацию о квотах памяти на уровне рабочих нагрузок, включая полное использование и запрашиваемые ресурсы.
- Current Network Usage: Таблица, представляющая текущую сетевую активность для выбранных контейнеров, включая полученные и переданные байты, пакеты и их потери.
- Receive Bandwidth: Временной график, отображающий скорость получения сетевых данных на уровне рабочих нагрузок.
- Transmit Bandwidth: Временной график, отображающий скорость передачи сетевых данных на уровне рабочих нагрузок.
- Average Container Bandwidth by Workload: Received: Временной график, показывающий среднюю скорость получения данных контейнерами по рабочей нагрузке.
- Average Container Bandwidth by Workload: Transmitted: Временной график, показывающий среднюю скорость передачи данных контейнерами по рабочей нагрузке.
- Rate of Received Packets: Временной график, отображающий скорость получения сетевых пакетов.
- Rate of Transmitted Packets: Временной график, отображающий скорость передачи сетевых пакетов.
- Rate of Received Packets Dropped: Временной график, показывающий скорость потерь полученных пакетов.
- Rate of Transmitted Packets Dropped: Временной график, показывающий скорость потерь переданных пакетов.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.
- type: Позволяет выбрать тип рабочей нагрузки (workload) для более детального анализа метрик.
Kubernetes/Compute Resources/Node (Pods)
Дашборд предназначен для мониторинга ресурсов вычислительных узлов в кластере Kubernetes. Он предоставляет важную информацию о потреблении ресурсов, таких как CPU и память, а также их квотах для отдельных подов. Пользователи могут быстро оценить текущее состояние узлов, контролируя максимальные доступные мощности и использование ресурсов, что является ключевым аспектом для обеспечения высокой производительности и стабильности приложений в контейнерах.
Скриншот

Структура дашборда
- CPU Usage: Отображает динамику использования CPU в подах, показывая как текущую загрузку, так и максимальную доступную мощность для заданного узла.
- CPU Quota: Таблица, отображающая квоты по CPU для подов, включая текущее использование, запрошенные ресурсы и лимиты.
- Memory Usage (w/o cache): Отображает использование памяти подами без учета кэша, а также максимальную доступную память для узла.
- Memory Quota: Таблица, которая отображает использование памяти подами, запросы и лимиты на память, а также разбиение по RSS, кэшам и свопам для более глубокого анализа.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для мониторинга, в данном случае используется VM Agent.
- node: Параметр для выбора узла в кластере, что также помогает в детальном анализе ресурсов на уровне узлов.
Kubernetes/Compute Resources/Pod
Дашборд предназначен для мониторинга ресурсов контейнеров в среде Kubernetes. Он предоставляет пользователям возможность отслеживать использование CPU и памяти, сетевые показатели, а также ввод-вывод операций на дисках. С помощью этого дашборда администраторы и разработчики могут быстро выявлять проблемы с производительностью и оптимизировать распределение ресурсов.
Скриншот

Структура дашборда
- CPU Usage: Отображает использование CPU в контейнерах выбранного пода на основе показателей, полученных из VM Agent.
- CPU Throttling: Показывает throttling CPU, что позволяет отслеживать ограничения на использование CPU.
- CPU Quota: Таблица, отображающая текущие лимиты и запросы на использование CPU.
- Memory Usage (WSS): Отображает использование рабочей памяти в контейнерах выбранного пода.
- Memory Quota: Таблица, показывающая лимиты и запросы на использование памяти для контейнеров.
- Receive Bandwidth: Отображает данные о входящей полосе пропускания для контейнеров.
- Transmit Bandwidth: Показывает данные о исходящей полосе пропускания для контейнеров.
- Rate of Received Packets: Отображает скорость получения пакетов.
- Rate of Transmitted Packets: Отображает скорость отправки пакетов.
- Rate of Received Packets Dropped: Показывает скорость получения потерянных пакетов.
- Rate of Transmitted Packets Dropped: Отображает скорость отправки потерянных пакетов.
- IOPS (Pod): Отображает количество операций ввода-вывода в секунду (IOPS) для пода.
- ThroughPut (Pod): Показывает скорость передачи данных (ThroughPut) для пода.
- IOPS (Containers): Отображает количество операций ввода-вывода в секунду (IOPS) для контейнеров.
- ThroughPut (Containers): Показывает скорость передачи данных (ThroughPut) для контейнеров.
- Current Storage IO: Таблица, показывающая текущие операции ввода и вывода для контейнеров, включая количество прочитанных и записанных байтов.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.
- pod: Позволяет выбрать один под для мониторинга или все поды на выбранном кластере.
Kubernetes/Compute Resources/Workload
Дашборд предназначен для мониторинга ресурсов вычислительной среды Kubernetes. Он предоставляет детальную информацию о нагрузках на CPU, памяти и сетевых интерфейсах, а также о квотах, выделенных под эти ресурсы. С помощью визуализации временных графиков и таблиц в реальном времени можно отслеживать производительность и эффективность использования ресурсов для различных workloads в кластере.
Скриншот

Структура дашборда
- CPU Usage: Отображает использование CPU для каждого пода с помощью временных графиков.
- CPU Quota: Таблица, отображающая информацию о квоте CPU, выделенной для подов в виде таблицы на основе различных метрик.
- Memory Usage: Презентует текущее использование памяти подами в формате временных графиков.
- Memory Quota: Демонстрирует квоты на использование памяти для подов с подробной информацией в виде таблицы.
- Current Network Usage: Отображает текущую сетевую активность подов с помощью таблицы, включая как входящий, так и исходящий трафик.
- Receive Bandwidth: Временной график, показывающий объем входящей сетевой активности для подов.
- Transmit Bandwidth: Временной график, показывающий объем исходящей сетевой активности для подов.
- Average Container Bandwidth by Pod: Received: Среднее значение входящего трафика по подам в формате временных графиков.
- Average Container Bandwidth by Pod: Transmitted: Среднее значение исходящего трафика по подам в формате временных графиков.
- Rate of Received Packets: Временной график, отображающий среднюю скорость получаемых сетевых пакетов.
- Rate of Transmitted Packets: Временной график, отображающий среднюю скорость отправляемых сетевых пакетов.
- Rate of Received Packets Dropped: Временной график, показывающий количество потерянных входящих пакетов.
- Rate of Transmitted Packets Dropped: Временной график, показывающий количество потерянных исходящих пакетов.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- cluster: Позволяет выбрать конкретный кластер Kubernetes для мониторинга.
- namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.
- type: Позволяет выбрать тип workload для отображаемых метрик.
- workload: Позволяет выбрать конкретный workload в заданном неймспейсе и кластере.
Kubernetes/Планировщик
Дашборд предназначен для мониторинга работы планировщика Kubernetes. Он позволяет отслеживать ключевые метрики, связанные с процессом планирования, включая количество активных планировщиков, задержки при планировании и статистику HTTP-запросов к API Kube. Дашборд предоставляет графическую визуализацию данных, что помогает в быстром выявлении и решении проблем с производительностью в кластере Kubernetes.
Скриншот

Структура дашборда
- Запущено: Отображает количество запущенных планировщиков в кластере.
- Интенсивность планирования: График, показывающий длительность различных стадий планирования в операциях в секунду.
- Задержка при планировании (99-й квартиль): График, показывающий99-й квартиль времени задержки при планировании для различных стадий планирования, таких как e2e, binding, scheduling algorithm и volume.
- Интенсивность запросов Kube API: График, показывающий количество HTTP-запросов, разделённых по коду статуса, методу и хосту.
- Задержка POST-запроса (99-й квартиль): График, показывающий 99-й квартиль задержки POST-запроса в секундах, сгруппированный по методам и URL.
- Задержка при GET-запросе (99-й квартиль): График, показывающий 99-й квартиль задержки GET-запроса в секундах, сгруппированный по методам и URL.
- Память: График, показывающий объём памяти, используемой планировщиком, в байтах.
- Использование ЦП: График, показывающий процессорное время, затрачиваемое на работающий планировщик.
- Go-рутины: График, показывающий число GO-рутин, используемых планировщиком.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- service: Позволяет выбрать сервис, для которого будут фильтроваться метрики, или выбрать все сервисы (All) кластера.
Kubernetes/StatefulSet
Дашборд предназначен для мониторинга состояния StatefulSet в Kubernetes кластере. Он предоставляет наглядные метрики, позволяющие отслеживать использование ресурсов, таких как процессор, память и сетевые взаимодействия, а также показатели, связанные с репликацией StatefulSet. Используя дашборд, пользователи могут эффективно анализировать производительность и состояние приложений, работающих в режиме Stateful.
Скриншот

Структура дашборда
- ЦП: Отображает процессорное время, затраченное на работу со стейфул.
- Память: Отображает объём памяти, используемый StatefulSet.
- Сеть: Отображает количество байт, переданных и отправленных StatefulSet.
- Требуется реплик: Отображает максимально возможное число реплик.
- Количество реплик этой версии: Отображает максимально доступное количество реплик на данный момент.
- Наблюдаемая версия: Отображает номер генерации, наблюдаемую контроллером развертывания.
- Генерация метаданных: Отображает номер последовательности, представляющий конкретную генерацию желаемого состояния StatefulSet.
- Реплики: Временной график метрик по репликам, включая максимальное, созданное, готовое и обновленное число реплик.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда. (например, VM Agent).
- cluster: Позволяет выбрать кластер Kubernetes для мониторинга.
- namespace: Позволяет выбрать неймспейс, в пределах которого будут мониториться ресурсы.
- statefulset: Назначение - выбор конкретного StatefulSet для детального мониторинга.
Kubernetes/Views/Global
Дашборд предназначен для мониторинга Kubernetes кластеров и представляет собой современный “Глобальный обзор”, созданный для kube-VM Agent-stack и использующий последние функции Grafana. Он позволяет пользователям отслеживать ресурсы кластера, такие как использование процессора и памяти, количество узлов, подов и другие метрики, что обеспечивает эффективное управление ресурсами и поддержание стабильной работы приложений.
Скриншот

Структура дашборда
-
Overview:
- Global CPU Usage: Отображает данные о среднем использовании ЦП в процентовом соотношении, включая метрики по реальному использованию, запросам и лимитам ресурсов.
- Global RAM Usage: Представляет информацию об использовании оперативной памяти, включая реальные данные, запросы и лимиты памяти.
- Nodes: Панель показывает общее количество узлов в кластере.
- Kubernetes Resource Count: Визуализирует количество различных ресурсов Kubernetes, включая неймспейсы, запущенные контейнеры, поды, сервисы и другие.
- Namespaces: Отображает общее количество созданных неймспейсов в кластере.
- CPU Usage: Информирует о текущем использовании ЦП в кластере, включая реальные данные, запросы, лимиты и общее количество ядер ЦП.
- RAM Usage: Показатели использования оперативной памяти, включая реальные данные, запросы и лимиты, а также общее количество доступной памяти.
- Running Pods: Отображает текущее количество запущенных подов.
-
Resources:
- Cluster CPU Utilization: График, показывающий среднее использование ЦП на кластер в процентах.
- Cluster Memory Utilization: Выводит процентное использование оперативной памяти кластера.
- CPU Utilization by namespace: Оценка использования ЦП по отдельным неймспейсам.
- Memory Utilization by namespace: Отображает использование оперативной памяти по неймспейсам.
- CPU Utilization by node: График средних показателей использования ЦП для каждого узла.
- Memory Utilization by node: Визуализация использования оперативной памяти по узлам.
- CPU Throttled seconds by namespace: Отображает информацию о времени простоя ЦП по неймспейсам.
- CPU Core Throttled by node: Панель показывает, сколько времени ядра ЦП находились в состоянии ограничения.
-
Kubernetes:
- Kubernetes Pods QoS classes: Отображает количество подов по классам качества обслуживания (QoS).
- Kubernetes Pods Status Reason: Информирует о причинах статусов подов.
- OOM Events by namespace: Отображает количество событий завершения работы из-за недостатка памяти по неймспейсам.
- Container Restarts by namespace: Информирует о количестве перезапусков контейнеров по неймспейсам.
-
Network:
- Global Network Utilization by device: Отражает загрузку сети по устройствам, исключая виртуальные устройства.
- Network Saturation - Packets dropped: Показывает количество потерянных пакетов при получении и отправке данных.
- Network Received by namespace: Отображает получение и передачу данных по неймспейсам.
- Total Network Received (with all virtual devices) by node: Информация о полученных и переданных данных по узлам, включая все виртуальные устройства.
- Network Received (without loopback) by node: Показывает сетевую активность по узлам без учета петлевых устройств.
- Network Received (loopback only) by node: Визуализация сетевой активности только по петлевым устройствам на узлах.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- role: Позволяет пользователю выбрать роль узлов для фильтрации метрик.
- node: Предоставляет возможность фильтровать метрики по конкретному узлу.
- resolution: Позволяет пользователю выбрать временное разрешение для отображаемых данных (1s, 15s, 30s, 1m, 3m, 5m).
Kubernetes/System/CoreDNS
Дашборд представляет собой решение для мониторинга CoreDNS в кластерах Kubernetes. Он создан для использования совместно с kube-prometheus-stack и реализует последние функции Grafana. Дашборд позволяет отслеживать различные метрики, связанные с работой CoreDNS, включая статус здоровья, использование ресурсов, статистику DNS-запросов и кэширования.
Скриншот

Структура дашборда
- CoreDNS - Health Status: Отображает состояние здоровья экземпляров CoreDNS, проверяя доступность сервиса через метрику
up. - CoreDNS - CPU Usage by instance: Показывает использование процессора по каждому экземпляру CoreDNS, используя метрику
process_cpu_seconds_total. - CoreDNS - Memory Usage by instance: Демонстрирует использование памяти по экземплярам CoreDNS, основываясь на метрике
process_resident_memory_bytes. - CoreDNS - Total DNS Requests ($protocol): Отображает общее количество DNS-запросов за определенный период, с возможностью фильтрации по протоколу.
- CoreDNS - Average Packet Size ($protocol): Предоставляет данные о средней величине пакета DNS-запроса, сгруппированные по протоколам.
- CoreDNS - Requests by type: Позволяет увидеть количество DNS-запросов, разделенных по типам (A, AAAA, CNAME и т.д.).
- CoreDNS - Requests by return code: Показывает, сколько запросов было выполнено с различными кодами возврата (например, SUCCESS, SERVFAIL).
- CoreDNS - Total Forward Requests: Отображает общее количество запросов, перенаправленных на другие DNS-серверы. Не используется
- CoreDNS - DNS Errors: Информирует о количестве ошибок DNS (например, SERVFAIL и REFUSED), возникающих во время операций. Не используется
- CoreDNS - Cache Hits / Misses: Предоставляет метрики кэширования, показывающие количество попаданий и промахов при использовании кэша DNS.
- CoreDNS - Cache Size: Отображает размер кэша DNS, агрегируя данные по типам.
- CoreDNS - DNS request duration: Отображает тепловую карту времени обработки DNS-запросов.
- CoreDNS - DNS request size: Представляет размеры DNS-запросов в виде тепловой карты.
- CoreDNS - DNS response size: Показывает размеры DNS-ответов в виде тепловой карты.
Настраиваемые параметры
- datasource: Позволяет выбрать источник данных для настройки дашборда.
- cluster: Позволяет выбрать кластер Kubernetes для мониторинга. Переменная запрашивает уникальные значения метки
clusterиз метрикиkube_node_info. - instance: Позволяет фильтровать мониторинг по экземплярам CoreDNS, основанным на состоянии работы. Эта переменная включает все доступные экземпляры для выбора.
- protocol: Позволяет выбрать протокол для отображения метрик DNS-запросов (например, UDP или TCP).
- resolution: ППозволяет выбрать разрешение данных для отображения метрик, с доступными значениями от 1 секунды до 5 минут.
- job: Позволяет выбрать заданиt (jobs), чтобы фильтровать метрики CoreDNS по различным задачам.