Перейти к основному содержимому

Мониторинг кластера Kafka

В облачных базах данных Kafka можно отслеживать состояние кластера.

Для оценки общего состояния кластера посмотрите его статус.

Для более детального анализа можно:

Время в панели управления соответствует времени, установленному на вашем устройстве, и не зависит от региона, где размещен кластер.

примечание

Например, вы создали кластер в Ташкенте, в пуле uz-1. Ташкент находится в часовом поясе UTC+5. На устройстве, с которого вы зашли в панель управления, установлен часовой пояс UTC+3. Время на графиках метрик будет отображаться в UTC+3.

Посмотреть статус кластера

  1. В панели управления в верхнем меню нажмите Продукты и выберите Облачные базы данных.

  2. Откройте вкладку Активные.

  3. В строке кластера посмотрите статус.

    ACTIVEКластер доступен
    CREATINGКластер создается
    UPDATINGК кластеру применяются изменения
    RESIZINGКластер масштабируется
    ERRORПроизошла ошибка, создайте тикет
    DISK FULL

    Диск заполнен, кластер работает только на чтение. Чтобы кластер работал на чтение и запись, освободите место на диске или масштабируйте кластер и выберите конфигурацию с бóльшим размером диска

    DEGRADEDЧасть нод кластера недоступна
    DELETINGКластер удаляется

Посмотреть состояние нод кластера

  1. В панели управления в верхнем меню нажмите Продукты и выберите Облачные базы данных.
  2. Откройте вкладку Активные.
  3. Откройте страницу кластера → вкладка Мониторинг.
  4. В блоке Мониторинг кластера посмотрите доступные метрики нод кластера.

Метрики нод кластера в панели управления

ПамятьЗанятая память без учета кэша и буферов операционной системы в процентах или гигабайтах
vCPUНа сколько процентов загружены ядра нод кластера
CPU iowaitCколько процентов времени процессор потратил на ожидание ввода/вывода
Диск

Занятое место на диске в процентах или гигабайтах. Учитывает часть дискового пространства, зарезервированную под служебные нужды и недоступную для размещения баз данных. Подробнее о резервировании дискового пространства в инструкции Использование дискового пространства в кластере Kafka

Load Average

Среднее значение загрузки системы за период времени. Показывает, какое количество процессов обрабатывается ядрами кластера. Показатель представлен в виде трех значений — за одну минуту, пять минут и 15 минут. Эти значения должны быть не больше, чем количество ядер на ноде

OOM

Количество процессов, которые завершились ошибкой Out of Memory из-за нехватки оперативной памяти

Нагрузка диска

Скорость чтения и записи данных в КБ/с или количество операций чтения и записи в секунду

Нагрузка сетиКоличество бит или пакетов, отправленных и принятых через сетевой интерфейс

Экспортировать метрики в формате Prometheus

Историческая информация для кластеров недоступна — метрики запрашиваются только в режиме реального времени. Список всех метрик, которые поддерживаются в облачных базах данных, и их описание можно посмотреть в таблице Метрики в формате Prometheus.

  1. Получите токен.
  2. Получите метрики в формате Prometheus.

1. Получить токен

Токен дает доступ к метрикам всех кластеров проекта в одном пуле.

  1. В панели управления в верхнем меню нажмите Продукты и выберите Облачные базы данных.

  2. Откройте вкладку Активные.

  3. Откройте страницу кластера → вкладка Мониторинг.

  4. В блоке Токены для Prometheus нажмите Создать токен. Токен будет сгенерирован автоматически.

  5. Скопируйте токен. Для этого в строке токена нажмите.

2. Получить метрики в формате Prometheus

  1. Добавьте в конфигурационный файл Prometheus:

    scrape_configs:
    - job_name: get-metrics-from-dbaas
    scrape_interval: 1m
    static_configs:
    - targets:
    - '<domain>'
    scheme: https
    authorization:
    type: Bearer
    credentials: <token>

    Укажите:

    • <domain> — домен Managed Databases API. Это часть URL для обращения к API без https:// и /v1, например uz-1.dbaas.api.servercore.com. URL зависит от региона и пула, можно посмотреть в списке URL;
    • <token> — токен, который вы скопировали при получении токена на шаге 5.
  2. Откройте в браузере страницу, на которой будут доступны метрики в формате Prometheus:

    http://<ip_address>:9090/targets

    Укажите <ip_address> — IP-адрес, на котором установлен Prometheus.

  3. Самостоятельно настройте мониторинг и алерты для кластеров баз данных.

Метрики в формате Prometheus

Метрики в формате Prometheus предоставляются для всех кластеров. Конкретный кластер можно найти по идентификатору кластера базы данных в лейбле ds_id.

dbaas_memory_percentЗанятая память без учета кэша и буферов операционной системы (RAM) в процентах
dbaas_memory_bytesЗанятая память без учета кэша и буферов операционной системы (RAM) в байтах
dbaas_oom_countКоличество процессов, которые завершились ошибкой Out of Memory из-за нехватки оперативной памяти
dbaas_cpuИспользование vCPU на нодах кластера базы данных в процентах
dbaas_cpu_iowaitВремя ожидания ввода/вывода в процентах
dbaas_disk_percent

Занятое место на диске в процентах. Учитывает часть дискового пространства, зарезервированную под служебные нужды и недоступную для размещения баз данных. Подробнее о резервировании дискового пространства в инструкции Использование дискового пространства в кластере Kafka

dbaas_disk_bytes

Занятое место на диске в байтах. Учитывает часть дискового пространства, зарезервированную под служебные нужды и недоступную для размещения баз данных. Подробнее о резервировании дискового пространства в инструкции Использование дискового пространства в кластере Kafka

dbaas_disk_read_iopsКоличество операций чтения в секунду
dbaas_disk_write_iopsКоличество операций записи в секунду
dbaas_disk_read_bytesСкорость чтения данных с диска в байтах в секунду
dbaas_disk_write_bytesСкорость записи данных на диск в байтах в секунду
dbaas_node_load1Среднее значение загрузки системы за одну минуту. Показывает, какое количество процессов обрабатывается ядрами кластера
dbaas_node_load5Среднее значение загрузки системы за пять минут. Показывает, какое количество процессов обрабатывается ядрами кластера
dbaas_node_load15Среднее значение загрузки системы за 15 минут. Показывает, какое количество процессов обрабатывается ядрами кластера
dbaas_network_receive_bytesКоличество байт, принятых через сетевой интерфейс
dbaas_network_transmit_bytesКоличество байт, отправленных через сетевой интерфейс
dbaas_network_receive_packetsКоличество пакетов, принятых через сетевой интерфейс в секунду
dbaas_network_transmit_packetsКоличество пакетов, отправленных через сетевой интерфейс в секунду
dbaas_role

Роль ноды:

  • 0 — роль неизвестна;
  • 1 — мастер;
  • 2 — реплика