Перейти к основному содержанию
Перейти к основному содержанию

system.asynchronous_metrics

Выполнение запросов в ClickHouse Cloud

Данные в этой системной таблице хранятся локально на каждом узле в ClickHouse Cloud. Поэтому для получения полного обзора всех данных требуется функция clusterAllReplicas. Подробности см. здесь.

Содержит метрики, которые периодически вычисляются в фоновом режиме. Например, объём используемой оперативной памяти.

Столбцы:

  • metric (String) — имя метрики.
  • value (Float64) — значение метрики.
  • description (String) — описание метрики.

Пример

SELECT * FROM system.asynchronous_metrics LIMIT 10
┌─metric──────────────────────────────────┬──────value─┬─description────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┐
│ AsynchronousMetricsCalculationTimeSpent │ 0.00179053 │ Время в секундах, затраченное на вычисление асинхронных метрик (накладные расходы асинхронных метрик).                                                                                                                                              │
│ NumberOfDetachedByUserParts             │          0 │ Общее количество кусков, отсоединённых от таблиц MergeTree пользователями с помощью запроса `ALTER TABLE DETACH` (в отличие от неожиданных, повреждённых или игнорируемых кусков). Сервер не учитывает отсоединённые куски, и они могут быть удалены.                          │
│ NumberOfDetachedParts                   │          0 │ Общее количество кусков, отсоединённых от таблиц MergeTree. Кусок может быть отсоединён пользователем с помощью запроса `ALTER TABLE DETACH` или самим сервером, если кусок повреждён, неожиданный или не нужен. Сервер не учитывает отсоединённые куски, и они могут быть удалены. │
│ TotalRowsOfMergeTreeTables              │    2781309 │ Общее количество строк (записей), хранящихся во всех таблицах семейства MergeTree.                                                                                                                                                                                   │
│ TotalBytesOfMergeTreeTables             │    7741926 │ Общий объём данных в байтах (сжатых, включая данные и индексы), хранящихся во всех таблицах семейства MergeTree.                                                                                                                                                   │
│ NumberOfTables                          │         93 │ Общее количество таблиц по всем базам данных на сервере, за исключением баз данных, которые не могут содержать таблицы MergeTree. Исключаемые движки баз данных — это те, которые генерируют набор таблиц динамически, такие как `Lazy`, `MySQL`, `PostgreSQL`, `SQlite`. │
│ NumberOfDatabases                       │          6 │ Общее количество баз данных на сервере.                                                                                                                                                                                                                   │
│ MaxPartCountForPartition                │          6 │ Максимальное количество кусков на партицию среди всех партиций всех таблиц семейства MergeTree. Значения больше 300 указывают на неправильную конфигурацию, перегрузку или массовую загрузку данных.                                                                       │
│ ReplicasSumMergesInQueue                │          0 │ Сумма операций слияния в очереди (ещё не применённых) по всем реплицируемым таблицам.                                                                                                                                                                       │
│ ReplicasSumInsertsInQueue               │          0 │ Сумма операций INSERT в очереди (ещё не реплицированных) по всем реплицируемым таблицам.                                                                                                                                                                   │
└─────────────────────────────────────────┴────────────┴────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────────┘

Описание метрик

AsynchronousHeavyMetricsCalculationTimeSpent

Время в секундах, затраченное на вычисление асинхронных тяжёлых метрик (связанных с таблицами) (это накладные расходы на асинхронные метрики).

AsynchronousHeavyMetricsUpdateInterval

Интервал обновления тяжёлых метрик (связанных с таблицами).

AsynchronousMetricsCalculationTimeSpent

Время в секундах, затраченное на вычисление асинхронных метрик (это накладные расходы на асинхронные метрики).

AsynchronousMetricsUpdateInterval

Интервал обновления метрик.

BlockActiveTime_name

Время в секундах, в течение которого на блочном устройстве находились в очереди I/O‑запросы. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardBytes_name

Количество отброшенных байт на блочном устройстве. Эти операции актуальны для SSD. Операции discard не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardMerges_name

Количество операций discard для блочного устройства, которые были объединены планировщиком ввода-вывода ОС. Эти операции актуальны для SSD. Операции discard не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardOps_name

Количество операций discard для блочного устройства. Эти операции актуальны для SSD. Операции discard не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardTime_name

Время в секундах, затраченное на операции discard для блочного устройства, суммарно по всем операциям. Эти операции актуальны для SSD. Операции discard не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockInFlightOps_name

Это значение показывает количество запросов ввода-вывода, которые были отправлены драйверу устройства, но ещё не завершены. Оно не включает I/O‑запросы, которые находятся в очереди, но ещё не отправлены драйверу устройства. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockQueueTime_name

Это значение показывает количество миллисекунд, в течение которых I/O‑запросы ожидали на этом блочном устройстве. Если одновременно ожидает несколько I/O‑запросов, это значение увеличивается как произведение количества миллисекунд на количество ожидающих запросов. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadBytes_name

Количество байт, прочитанных с блочного устройства. Оно может быть меньше, чем количество байт, прочитанных из файловой системы, из-за использования страничного кэша ОС, который сокращает обращения к I/O. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadMerges_name

Количество операций чтения для блочного устройства, которые были объединены планировщиком ввода-вывода ОС. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadOps_name

Количество операций чтения, запрошенных у блочного устройства. Это системная метрика: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadTime_name

Время в секундах, затраченное на операции чтения, запрошенные у блочного устройства, суммарно по всем операциям. Это системная метрика: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteBytes_name

Количество байт, записанных на блочное устройство. Оно может быть меньше количества байт, записанных в файловую систему, из‑за использования страничного кэша ОС, который сокращает операции ввода‑вывода. Запись на блочное устройство может произойти позже соответствующей записи в файловую систему из‑за write-through‑кэширования. Это системная метрика: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteMerges_name

Количество операций записи, запрошенных у блочного устройства и объединённых планировщиком ввода‑вывода ОС. Это системная метрика: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteOps_name

Количество операций записи, запрошенных у блочного устройства. Это системная метрика: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteTime_name

Время в секундах, затраченное на операции записи, запрошенные у блочного устройства, суммарно по всем операциям. Это системная метрика: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt

CPUFrequencyMHz_name

Текущая частота CPU в МГц. Большинство современных CPU динамически регулируют частоту для энергосбережения и Turbo Boost.

DictionaryMaxUpdateDelay

Максимальная задержка (в секундах) обновления словаря.

DictionaryTotalFailedUpdates

Количество ошибок с момента последней успешной загрузки во всех словарях.

DiskAvailable_name

Доступное количество байт на диске (виртуальная файловая система). Удалённые файловые системы могут показывать большое значение, например 16 EiB.

DiskTotal_name

Общий размер диска (виртуальной файловой системы) в байтах. Удалённые файловые системы могут показывать большое значение, например 16 EiB.

DiskUnreserved_name

Доступное количество байт на диске (виртуальная файловая система) без учёта резервов под слияния, выборки и перемещения. Удалённые файловые системы могут показывать большое значение, например 16 EiB.

DiskUsed_name

Количество использованных байт на диске (виртуальная файловая система). Удалённые файловые системы не всегда предоставляют эту информацию.

FilesystemCacheBytes

Общее количество байт в виртуальной файловой системе cache. Этот кэш хранится на диске.

FilesystemCacheFiles

Общее количество кэшированных сегментов файлов в виртуальной файловой системе cache. Этот кэш хранится на диске.

FilesystemLogsPathAvailableBytes

Доступное количество байт на томе, где смонтирован путь к логам ClickHouse. Если это значение приближается к нулю, следует настроить ротацию логов в конфигурационном файле.

FilesystemLogsPathAvailableINodes

Количество доступных inode на томе, где смонтирован путь к логам ClickHouse.

FilesystemLogsPathTotalBytes

Размер тома, где смонтирован путь к логам ClickHouse, в байтах. Рекомендуется иметь не менее 10 ГБ под логи.

FilesystemLogsPathTotalINodes

Общее количество inode на томе, где смонтирован путь к логам ClickHouse.

FilesystemLogsPathUsedBytes

Количество использованных байт на томе, где смонтирован путь к логам ClickHouse.

FilesystemLogsPathUsedINodes

Количество использованных inode на томе, где смонтирован путь к логам ClickHouse.

FilesystemMainPathAvailableBytes

Доступное количество байт на томе, где смонтирован основной путь ClickHouse.

FilesystemMainPathAvailableINodes

Количество доступных inode на томе, где смонтирован основной путь ClickHouse. Если значение близко к нулю, это указывает на ошибочную конфигурацию, и вы получите ошибку no space left on device, даже если диск не заполнен.

FilesystemMainPathTotalBytes

Размер тома, где смонтирован основной путь ClickHouse, в байтах.

FilesystemMainPathTotalINodes

Общее количество inode на томе, где смонтирован основной путь ClickHouse. Если оно меньше 25 миллионов, это указывает на ошибочную конфигурацию.

FilesystemMainPathUsedBytes

Используемое количество байт на томе, где смонтирован основной путь ClickHouse.

FilesystemMainPathUsedINodes

Количество использованных inode на томе, где смонтирован основной путь ClickHouse. Это значение в основном соответствует количеству файлов.

HTTPThreads

Количество потоков в сервере HTTP-интерфейса (без TLS).

InterserverThreads

Количество потоков в сервере протокола взаимодействия реплик (без TLS).

Jitter

Разница между моментом времени, когда поток для расчета асинхронных метрик должен был быть запланирован к пробуждению, и моментом времени, когда он фактически был пробуждён. Косвенный индикатор общей задержки и отзывчивости системы.

LoadAverageN

Нагрузка на всю систему, усреднённая с экспоненциальным сглаживанием за 1 минуту. Нагрузка представляет собой количество потоков во всех процессах (сущностей, планируемых ядром ОС), которые в данный момент выполняются на CPU, ожидают IO или готовы к выполнению, но в данный момент не запланированы. Это число включает в себя все процессы, а не только clickhouse-server. Значение может быть больше количества ядер CPU, если система перегружена и многие процессы готовы к выполнению, но ожидают CPU или IO.

MaxPartCountForPartition

Максимальное количество кусков (parts) на партицию среди всех партиций всех таблиц семейства MergeTree. Значения больше 300 указывают на ошибочную конфигурацию, перегрузку или массовую загрузку данных.

MemoryCode

Объём виртуальной памяти, отображённой на страницы машинного кода процесса сервера, в байтах.

MemoryDataAndStack

Объём виртуальной памяти, отображённой для использования стека и выделенной памяти, в байтах. Не указано, включает ли он стеки отдельных потоков и большую часть выделенной памяти, которая выделяется с помощью системного вызова mmap. Эта метрика существует только для полноты. Рекомендуется использовать метрику MemoryResident для мониторинга.

MemoryResidentMax

Максимальный объём физической памяти, используемой процессом сервера, в байтах.

MemoryResident

Объём физической памяти, используемой процессом сервера, в байтах.

MemoryShared

Объём памяти, используемой процессом сервера и одновременно разделяемой с другими процессами, в байтах. ClickHouse не использует разделяемую память, но часть памяти может быть помечена ОС как разделяемая по её собственным причинам. За этой метрикой нет большого смысла наблюдать, она существует только для полноты.

MemoryVirtual

Размер виртуального адресного пространства, выделенного процессом сервера, в байтах. Размер виртуального адресного пространства обычно значительно больше фактического потребления физической памяти и не должен использоваться как оценка потребления памяти. Большие значения этой метрики являются совершенно нормальными и имеют лишь технический смысл.

MySQLThreads

Количество потоков в сервере протокола совместимости с MySQL.

NetworkReceiveBytes_name

Количество байт, полученных через сетевой интерфейс. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server.

NetworkReceiveDrop_name

Количество байт, потерянных при приёме пакетов через сетевой интерфейс. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server.

NetworkReceiveErrors_name

Количество случаев возникновения ошибок при приёме через сетевой интерфейс. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server.

NetworkReceivePackets_name

Количество сетевых пакетов, полученных через сетевой интерфейс. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.

NetworkSendBytes_name

Количество байт, отправленных через сетевой интерфейс. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.

NetworkSendDrop_name

Количество случаев, когда пакет был отброшен при отправке через сетевой интерфейс. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.

NetworkSendErrors_name

Количество случаев возникновения ошибки (например, повторная передача TCP) при отправке через сетевой интерфейс. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.

NetworkSendPackets_name

Количество сетевых пакетов, отправленных через сетевой интерфейс. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.

NumberOfDatabases

Общее количество баз данных на сервере.

NumberOfDetachedByUserParts

Общее количество частей, отделённых от таблиц MergeTree пользователями с помощью запроса ALTER TABLE DETACH (в отличие от неожиданных, повреждённых или игнорируемых частей). Сервер не отслеживает отделённые части, и их можно удалить.

NumberOfDetachedParts

Общее количество частей, отделённых от таблиц MergeTree. Часть может быть отделена пользователем с помощью запроса ALTER TABLE DETACH или самим сервером, если часть повреждена, неожиданна или не нужна. Сервер не отслеживает отделённые части, и их можно удалить.

NumberOfTables

Общее количество таблиц, суммированное по всем базам данных на сервере, за исключением баз данных, которые не могут содержать таблицы MergeTree. Исключены движки баз данных, которые формируют набор таблиц «на лету», такие как Lazy, MySQL, PostgreSQL, SQlite.

OSContextSwitches

Количество переключений контекста, которые произошли в системе на хостовой машине. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.

OSGuestNiceTime

Доля времени, затраченного на работу виртуального CPU для гостевых операционных систем под управлением ядра Linux, когда для гостя был установлен более высокий приоритет (см. man procfs). Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но присутствует для полноты. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].

OSGuestNiceTimeCPU_N

Доля времени, затраченного на работу виртуального CPU для гостевых операционных систем под управлением ядра Linux, когда для гостя был установлен более высокий приоритет (см. man procfs). Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но присутствует для полноты. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].

OSGuestNiceTimeNormalized

Значение аналогично OSGuestNiceTime, но поделено на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если число ядер неоднородно, и всё равно получать среднюю метрику использования ресурсов.

OSGuestTime

Доля времени, затраченного на работу виртуального CPU для гостевых операционных систем под управлением ядра Linux (см. man procfs). Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но присутствует для полноты. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].

OSGuestTimeCPU_N

Отношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под управлением ядра Linux (см. man procfs). Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но приведена для полноты. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма [0..num cores].

OSGuestTimeNormalized

Значение аналогично OSGuestTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от их числа. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере даже при неодинаковом количестве ядер и при этом получать среднюю метрику использования ресурсов.

OSIOWaitTime

Отношение времени, в течение которого ядро CPU не выполняло код, но при этом ядро ОС не запускало на этом CPU никакой другой процесс, так как процессы ожидали I/O. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма [0..num cores].

OSIOWaitTimeCPU_N

Отношение времени, в течение которого ядро CPU не выполняло код, но при этом ядро ОС не запускало на этом CPU никакой другой процесс, так как процессы ожидали I/O. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма [0..num cores].

OSIOWaitTimeNormalized

Значение аналогично OSIOWaitTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от их числа. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере даже при неодинаковом количестве ядер и при этом получать среднюю метрику использования ресурсов.

OSIdleTime

Отношение времени, в течение которого ядро CPU простаивало (даже не было готово выполнить процесс, ожидающий I/O) с точки зрения ядра ОС. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Она не включает время, когда CPU был недоиспользован по причинам, внутренним для самого CPU (загрузки памяти, простои конвейера, ошибочные предсказания переходов, выполнение другого SMT-ядра). Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма [0..num cores].

OSIdleTimeCPU_N

Отношение времени, в течение которого ядро CPU простаивало (даже не было готово выполнить процесс, ожидающий I/O) с точки зрения ядра ОС. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Она не включает время, когда CPU был недоиспользован по причинам, внутренним для самого CPU (загрузки памяти, простои конвейера, ошибочные предсказания переходов, выполнение другого SMT-ядра). Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма [0..num cores].

OSIdleTimeNormalized

Значение аналогично OSIdleTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от их числа. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере даже при неодинаковом количестве ядер и при этом получать среднюю метрику использования ресурсов.

OSInterrupts

Количество прерываний на хостовой машине. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server.

OSIrqTime

Отношение времени, затраченного на обработку аппаратных прерываний на CPU. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на некорректную конфигурацию оборудования или очень высокую сетевую нагрузку. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма [0..num cores].

OSIrqTimeCPU_N

Доля времени, затраченного на обработку аппаратных прерываний на CPU. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server. Высокое значение этой метрики может указывать на некорректную конфигурацию оборудования или очень высокую сетевую нагрузку. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].

OSIrqTimeNormalized

Значение аналогично OSIrqTime, но поделено на количество ядер CPU, чтобы укладываться в интервал [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер различается, и при этом получать усреднённую метрику использования ресурсов.

OSMemoryAvailable

Объём памяти, доступной для использования программами, в байтах. Эта метрика очень похожа на OSMemoryFreePlusCached. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.

OSMemoryBuffers

Объём памяти, используемой буферами ядра ОС, в байтах. Обычно это значение должно быть небольшим, а большие значения могут указывать на некорректную конфигурацию ОС. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.

OSMemoryCached

Объём памяти, используемой страничным кэшем ОС, в байтах. Как правило, почти вся доступная память используется страничным кэшем ОС — высокие значения этой метрики являются нормальными и ожидаемыми. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.

OSMemoryFreePlusCached

Объём свободной памяти плюс память страничного кэша ОС на хост-системе, в байтах. Эта память доступна для использования программами. Значение должно быть очень близко к OSMemoryAvailable. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.

OSMemoryFreeWithoutCached

Объём свободной памяти на хост-системе, в байтах. Это значение не включает память, используемую страничным кэшем ОС. Память страничного кэша также доступна для использования программами, поэтому значение этой метрики может быть неоднозначным. Вместо неё см. метрику OSMemoryAvailable. Для удобства также предоставляется метрика OSMemoryFreePlusCached, которая должна быть примерно аналогична OSMemoryAvailable. См. также https://www.linuxatemyram.com/. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.

OSMemoryTotal

Общий объём памяти на хост-системе, в байтах.

OSNiceTime

Доля времени, когда ядро CPU выполняло пользовательский код с повышенным приоритетом. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].

OSNiceTimeCPU_N

Доля времени, когда указанное ядро CPU выполняло пользовательский код с повышенным приоритетом. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].

OSNiceTimeNormalized

Значение аналогично OSNiceTime, но поделено на количество ядер CPU, чтобы укладываться в интервал [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер различается, и при этом получать усреднённую метрику использования ресурсов.

OSOpenFiles

Общее количество открытых файлов на хост-системе. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.

OSProcessesBlocked

Количество потоков, заблокированных в ожидании завершения операций ввода-вывода (man procfs). Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.

OSProcessesCreated

Количество созданных процессов. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.

OSProcessesRunning

Количество потоков, которые могут выполняться (запущены или готовы к запуску), по данным операционной системы. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.

OSSoftIrqTime

Доля времени, затраченного на обработку программных запросов прерываний на CPU. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективно работающее программное обеспечение в системе. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].

OSSoftIrqTimeCPU_N

Доля времени, затраченного на обработку программных запросов прерываний на CPU. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективно работающее программное обеспечение в системе. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].

OSSoftIrqTimeNormalized

Значение аналогично OSSoftIrqTime, но разделено на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер отличается, и при этом получать усреднённую метрику использования ресурсов.

OSStealTime

Доля времени, которое CPU проводит в других операционных системах при работе в виртуализованной среде. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Не все виртуализованные среды предоставляют эту метрику, и большинство — нет. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].

OSStealTimeCPU_N

Доля времени, которое CPU проводит в других операционных системах при работе в виртуализованной среде. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Не все виртуализованные среды предоставляют эту метрику, и большинство — нет. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].

OSStealTimeNormalized

Значение аналогично OSStealTime, но разделено на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер отличается, и при этом получать усреднённую метрику использования ресурсов.

OSSystemTime

Доля времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].

OSSystemTimeCPU_N

Доля времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].

OSSystemTimeNormalized

Значение аналогично OSSystemTime, но разделено на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер отличается, и при этом получать усреднённую метрику использования ресурсов.

OSThreadsRunnable

Общее количество потоков в состоянии «runnable», как его видит планировщик ядра ОС.

OSThreadsTotal

Общее количество потоков, с точки зрения планировщика ядра ОС.

OSUptime

Время непрерывной работы хост-сервера (машины, на которой запущен ClickHouse), в секундах.

OSUserTime

Доля времени, когда ядро CPU выполняло пользовательский код (userspace). Это метрика для всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Сюда также входит время, когда CPU был недоиспользован по причинам, внутренним для самого CPU (загрузки из памяти, остановки конвейера, ошибочные предсказания переходов, выполнение другого SMT-ядра). Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..число ядер].

OSUserTimeCPU_N

Доля времени, когда ядро CPU выполняло пользовательский код (userspace). Это метрика для всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Сюда также входит время, когда CPU был недоиспользован по причинам, внутренним для самого CPU (загрузки из памяти, остановки конвейера, ошибочные предсказания переходов, выполнение другого SMT-ядра). Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..число ядер].

OSUserTimeNormalized

Значение аналогично OSUserTime, но делится на количество ядер CPU, чтобы оставаться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если число ядер неоднородно, и при этом получать корректную усреднённую метрику использования ресурсов.

PostgreSQLThreads

Количество потоков в сервере протокола совместимости с PostgreSQL.

ReplicasMaxAbsoluteDelay

Максимальная разница в секундах между самой свежей реплицированной частью и самой свежей частью данных, ещё не реплицированной, по всем Replicated-таблицам. Очень большое значение указывает на реплику без данных.

ReplicasMaxInsertsInQueue

Максимальное количество операций INSERT в очереди (ещё не реплицированных) по всем Replicated-таблицам.

ReplicasMaxMergesInQueue

Максимальное количество операций слияния в очереди (ещё не применённых) по всем Replicated-таблицам.

ReplicasMaxQueueSize

Максимальный размер очереди (по количеству операций типа get, merge) по всем Replicated-таблицам.

ReplicasMaxRelativeDelay

Максимальная разница между задержкой реплики и задержкой самой актуальной реплики той же таблицы по всем Replicated-таблицам.

ReplicasSumInsertsInQueue

Суммарное количество операций INSERT в очереди (ещё не реплицированных) по всем Replicated-таблицам.

ReplicasSumMergesInQueue

Суммарное количество операций слияния в очереди (ещё не применённых) по всем Replicated-таблицам.

ReplicasSumQueueSize

Суммарный размер очереди (по количеству операций типа get, merge) по всем Replicated-таблицам.

TCPThreads

Количество потоков в сервере протокола TCP (без TLS).

Temperature_N

Температура соответствующего устройства в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/thermal

Temperature_name

Температура, сообщаемая соответствующим аппаратным монитором и соответствующим датчиком, в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/hwmon

TotalBytesOfMergeTreeTables

Общее количество байт (сжатых, включая данные и индексы), хранящихся во всех таблицах семейства MergeTree.

TotalPartsOfMergeTreeTables

Общее количество частей данных во всех таблицах семейства MergeTree. Значения больше 10 000 будут отрицательно влиять на время запуска сервера и могут указывать на неудачный выбор ключа партиционирования.

TotalPrimaryKeyBytesInMemory

Объём памяти (в байтах), используемой значениями первичного ключа (учитываются только активные части).

TotalPrimaryKeyBytesInMemoryAllocated

Объём памяти (в байтах), зарезервированной под значения первичного ключа (учитываются только активные части).

TotalRowsOfMergeTreeTables

Общее количество строк (записей), хранимых во всех таблицах семейства MergeTree.

Uptime

Время работы сервера в секундах. Включает время, затраченное на инициализацию сервера до начала приёма подключений.

jemalloc.active

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.allocated

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.dirty_purged

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.muzzy_purged

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pactive

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pdirty

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pmuzzy

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_runs

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_threads

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.run_intervals

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.epoch

Внутренний инкрементальный номер обновления статистики jemalloc (распределителя памяти Джейсона Эванса), используемый во всех остальных метриках jemalloc.

jemalloc.mapped

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.metadata

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.metadata_thp

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.resident

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.retained

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.prof.active

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

См. также

  • Monitoring — Базовые концепции мониторинга ClickHouse.
  • system.metrics — Содержит мгновенно вычисляемые метрики.
  • system.events — Содержит количество произошедших событий.
  • system.metric_log — Содержит историю значений метрик из таблиц system.metrics и system.events.