Перейти к содержанию

Метрики в Prometheus/Grafana

Начиная с версии 3.16.0, Система предоставляет данные для метрик в формате, совместимом с Prometheus/Grafana.

Настройка

Для того чтобы начать работу с метриками, необходимо обновить Систему до версии 3.16.0 (см. раздел «Обновление 3.15.0 до 3.16.0» для Docker или Kubernetes).

После обновления метрики станут доступны в Prometheus.

Для отображения метрик в Grafana можно использовать базовый дашборд JVM Micrometer. Этот дашборд «из коробки» будет работать только с метриками /actuator/prometheus. Чтобы были видны остальные метрики, необходимо провести кастомизацию дашборда.

Список метрик

  1. Список активных метрик в /actuator:

    • GET /actuator - вывод всех доступных endpoints метрик.
    • GET /actuator/metrics - вывод всех доступных метрик.
    • GET /actuator/health - состояние всех сервисов.
    • GET /actuator/prometheus - доступные метрики в формате Prometheus.
    • GET /actuator/info - общие сведения о приложении: версия, дата билда, имя билда.
  2. Основные метрики о состоянии БД PotgreSQL:

    • GET /actuator/health/r2bdc - состояние PostgreSQL (status, version).

    a. Группа метрик о состоянии БД PotgreSQL:

    • GET /actuator/metrics/r2dbc.pool.acquired
    • GET /actuator/metrics/r2dbc.pool.allocated
    • GET /actuator/metrics/r2dbc.pool.idle
    • GET /actuator/metrics/r2dbc.pool.max.allocated
    • GET /actuator/metrics/r2dbc.pool.max.pending
    • GET /actuator/metrics/r2dbc.pool.pending

    b. Группа метрик о состоянии БД PotgreSQL в формате Promeheus:

    • GET //prometheus?includedNames=r2dbc_pool_...
  3. Основные метрики о состоянии Redis:

    • GET /actuator/health/redis - состояние Redis (status, version)

    a. Группа метрик о состоянии Redis:

    • GET /actuator/metrics/lettuce.command.completion
    • GET /actuator/metrics/lettuce.command.firstresponse

    b. Группа метрик о состоянии Redis в формате Promeheus:

    • GET /actuator/prometheus?includedNames=lettuce_command_...
  4. Используемые оперативная память / дисковое пространство:

    • GET /actuator/health/diskSpace - состояние дискового пространства.

    a. Группа метрик с информацией о дисковом пространстве:

    • GET /actuator/metrics/disk.free - свободное место на диске в байтах.
    • GET /actuator/metrics/disk.total - общий размер дискового пространства в байтах.

    b. Группа метрик с информацией об оперативной памяти:

    • GET /actuator/metrics/jvm.memory.used - используемый объем оперативной памяти в байтах.
    • GET /actuator/metrics/jvm.memory.max - выделенный объем оперативной памяти в байтах.
    • GET /actuator/metrics/jvm.memory.committed - подтвержденный объем оперативной памяти в байтах.
    • GET /actuator/metrics/jvm.memory.usage.after.gc - объем оперативной памяти после работы Garbage collection в %.

    c. Группа метрик с информацией о дисковом пространстве в формате Promeheus:

    • GET /actuator/prometheus?includedNames=disk_total_bytes,disk_free_bytes - где disk_total_bytes - общий размер диска, disk_free_bytes - свободное место на диске.

    d. Группа метрик с информацией об оперативной памяти в формате Promeheus:

    • GET /actuator/prometheus?includedNames=jvm_memory_used_bytes,jvm_memory_committed_bytes,jvm_memory_max_bytes,jvm_memory_usage_after_gc_percent - описание см. выше в пункте 3.b.
  5. Текущий используемый URL Сервиса данных (Track.Feed):

    • GET /actuator/metrics/actual_feed_core_url - информация об актуальном адресе Сервиса данных.
    • GET /actuator/actuator/prometheus?includedNames=actual_feed_core_url - информация об актуальном адресе Сервиса данных (feed) в формате Prometheus.
  6. Количество запросов в Сервис данных:

    • GET /actuator/metrics/history_log_count - количество запросов.
    • GET /actuator/prometheus?includedNames=history_log_count - количество запросов в формате Promeheus.
  7. Остальные метрики:

    • GET /actuator/metrics/logback.events - количество событий в логах приложения по уровням: warn, trace, debug, error, info.
    • GET /actuator/metrics/system.cpu.count - информация о процессоре. Количество процессоров.
    • GET /actuator/metrics/system.cpu.usage - информация о процессоре. Загруженность процессора.