system.asynchronous_metrics
Данные в этой системной таблице хранятся локально на каждом узле в ClickHouse Cloud. Поэтому для получения полного обзора всех данных требуется функция clusterAllReplicas. Подробности см. здесь.
Содержит метрики, которые периодически вычисляются в фоновом режиме. Например, объём используемой оперативной памяти.
Столбцы:
metric(String) — имя метрики.value(Float64) — значение метрики.description(String) — описание метрики.
Пример
Описание метрик
AsynchronousHeavyMetricsCalculationTimeSpent
Время в секундах, затраченное на вычисление асинхронных тяжёлых метрик (связанных с таблицами) (это накладные расходы на асинхронные метрики).
AsynchronousHeavyMetricsUpdateInterval
Интервал обновления тяжёлых метрик (связанных с таблицами).
AsynchronousMetricsCalculationTimeSpent
Время в секундах, затраченное на вычисление асинхронных метрик (это накладные расходы на асинхронные метрики).
AsynchronousMetricsUpdateInterval
Интервал обновления метрик.
BlockActiveTime_name
Время в секундах, в течение которого на блочном устройстве находились в очереди I/O‑запросы. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardBytes_name
Количество отброшенных байт на блочном устройстве. Эти операции актуальны для SSD. Операции discard не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardMerges_name
Количество операций discard для блочного устройства, которые были объединены планировщиком ввода-вывода ОС. Эти операции актуальны для SSD. Операции discard не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardOps_name
Количество операций discard для блочного устройства. Эти операции актуальны для SSD. Операции discard не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardTime_name
Время в секундах, затраченное на операции discard для блочного устройства, суммарно по всем операциям. Эти операции актуальны для SSD. Операции discard не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockInFlightOps_name
Это значение показывает количество запросов ввода-вывода, которые были отправлены драйверу устройства, но ещё не завершены. Оно не включает I/O‑запросы, которые находятся в очереди, но ещё не отправлены драйверу устройства. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockQueueTime_name
Это значение показывает количество миллисекунд, в течение которых I/O‑запросы ожидали на этом блочном устройстве. Если одновременно ожидает несколько I/O‑запросов, это значение увеличивается как произведение количества миллисекунд на количество ожидающих запросов. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadBytes_name
Количество байт, прочитанных с блочного устройства. Оно может быть меньше, чем количество байт, прочитанных из файловой системы, из-за использования страничного кэша ОС, который сокращает обращения к I/O. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadMerges_name
Количество операций чтения для блочного устройства, которые были объединены планировщиком ввода-вывода ОС. Это метрика на уровне всей системы, она включает все процессы на хосте, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadOps_name
Количество операций чтения, запрошенных у блочного устройства. Это системная метрика: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadTime_name
Время в секундах, затраченное на операции чтения, запрошенные у блочного устройства, суммарно по всем операциям. Это системная метрика: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteBytes_name
Количество байт, записанных на блочное устройство. Оно может быть меньше количества байт, записанных в файловую систему, из‑за использования страничного кэша ОС, который сокращает операции ввода‑вывода. Запись на блочное устройство может произойти позже соответствующей записи в файловую систему из‑за write-through‑кэширования. Это системная метрика: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteMerges_name
Количество операций записи, запрошенных у блочного устройства и объединённых планировщиком ввода‑вывода ОС. Это системная метрика: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteOps_name
Количество операций записи, запрошенных у блочного устройства. Это системная метрика: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteTime_name
Время в секундах, затраченное на операции записи, запрошенные у блочного устройства, суммарно по всем операциям. Это системная метрика: она учитывает все процессы на хостовой машине, а не только clickhouse-server. Источник: /sys/block. См. https://www.kernel.org/doc/Documentation/block/stat.txt
CPUFrequencyMHz_name
Текущая частота CPU в МГц. Большинство современных CPU динамически регулируют частоту для энергосбережения и Turbo Boost.
DictionaryMaxUpdateDelay
Максимальная задержка (в секундах) обновления словаря.
DictionaryTotalFailedUpdates
Количество ошибок с момента последней успешной загрузки во всех словарях.
DiskAvailable_name
Доступное количество байт на диске (виртуальная файловая система). Удалённые файловые системы могут показывать большое значение, например 16 EiB.
DiskTotal_name
Общий размер диска (виртуальной файловой системы) в байтах. Удалённые файловые системы могут показывать большое значение, например 16 EiB.
DiskUnreserved_name
Доступное количество байт на диске (виртуальная файловая система) без учёта резервов под слияния, выборки и перемещения. Удалённые файловые системы могут показывать большое значение, например 16 EiB.
DiskUsed_name
Количество использованных байт на диске (виртуальная файловая система). Удалённые файловые системы не всегда предоставляют эту информацию.
FilesystemCacheBytes
Общее количество байт в виртуальной файловой системе cache. Этот кэш хранится на диске.
FilesystemCacheFiles
Общее количество кэшированных сегментов файлов в виртуальной файловой системе cache. Этот кэш хранится на диске.
FilesystemLogsPathAvailableBytes
Доступное количество байт на томе, где смонтирован путь к логам ClickHouse. Если это значение приближается к нулю, следует настроить ротацию логов в конфигурационном файле.
FilesystemLogsPathAvailableINodes
Количество доступных inode на томе, где смонтирован путь к логам ClickHouse.
FilesystemLogsPathTotalBytes
Размер тома, где смонтирован путь к логам ClickHouse, в байтах. Рекомендуется иметь не менее 10 ГБ под логи.
FilesystemLogsPathTotalINodes
Общее количество inode на томе, где смонтирован путь к логам ClickHouse.
FilesystemLogsPathUsedBytes
Количество использованных байт на томе, где смонтирован путь к логам ClickHouse.
FilesystemLogsPathUsedINodes
Количество использованных inode на томе, где смонтирован путь к логам ClickHouse.
FilesystemMainPathAvailableBytes
Доступное количество байт на томе, где смонтирован основной путь ClickHouse.
FilesystemMainPathAvailableINodes
Количество доступных inode на томе, где смонтирован основной путь ClickHouse. Если значение близко к нулю, это указывает на ошибочную конфигурацию, и вы получите ошибку no space left on device, даже если диск не заполнен.
FilesystemMainPathTotalBytes
Размер тома, где смонтирован основной путь ClickHouse, в байтах.
FilesystemMainPathTotalINodes
Общее количество inode на томе, где смонтирован основной путь ClickHouse. Если оно меньше 25 миллионов, это указывает на ошибочную конфигурацию.
FilesystemMainPathUsedBytes
Используемое количество байт на томе, где смонтирован основной путь ClickHouse.
FilesystemMainPathUsedINodes
Количество использованных inode на томе, где смонтирован основной путь ClickHouse. Это значение в основном соответствует количеству файлов.
HTTPThreads
Количество потоков в сервере HTTP-интерфейса (без TLS).
InterserverThreads
Количество потоков в сервере протокола взаимодействия реплик (без TLS).
Jitter
Разница между моментом времени, когда поток для расчета асинхронных метрик должен был быть запланирован к пробуждению, и моментом времени, когда он фактически был пробуждён. Косвенный индикатор общей задержки и отзывчивости системы.
LoadAverageN
Нагрузка на всю систему, усреднённая с экспоненциальным сглаживанием за 1 минуту. Нагрузка представляет собой количество потоков во всех процессах (сущностей, планируемых ядром ОС), которые в данный момент выполняются на CPU, ожидают IO или готовы к выполнению, но в данный момент не запланированы. Это число включает в себя все процессы, а не только clickhouse-server. Значение может быть больше количества ядер CPU, если система перегружена и многие процессы готовы к выполнению, но ожидают CPU или IO.
MaxPartCountForPartition
Максимальное количество кусков (parts) на партицию среди всех партиций всех таблиц семейства MergeTree. Значения больше 300 указывают на ошибочную конфигурацию, перегрузку или массовую загрузку данных.
MemoryCode
Объём виртуальной памяти, отображённой на страницы машинного кода процесса сервера, в байтах.
MemoryDataAndStack
Объём виртуальной памяти, отображённой для использования стека и выделенной памяти, в байтах. Не указано, включает ли он стеки отдельных потоков и большую часть выделенной памяти, которая выделяется с помощью системного вызова mmap. Эта метрика существует только для полноты. Рекомендуется использовать метрику MemoryResident для мониторинга.
MemoryResidentMax
Максимальный объём физической памяти, используемой процессом сервера, в байтах.
MemoryResident
Объём физической памяти, используемой процессом сервера, в байтах.
MemoryShared
Объём памяти, используемой процессом сервера и одновременно разделяемой с другими процессами, в байтах. ClickHouse не использует разделяемую память, но часть памяти может быть помечена ОС как разделяемая по её собственным причинам. За этой метрикой нет большого смысла наблюдать, она существует только для полноты.
MemoryVirtual
Размер виртуального адресного пространства, выделенного процессом сервера, в байтах. Размер виртуального адресного пространства обычно значительно больше фактического потребления физической памяти и не должен использоваться как оценка потребления памяти. Большие значения этой метрики являются совершенно нормальными и имеют лишь технический смысл.
MySQLThreads
Количество потоков в сервере протокола совместимости с MySQL.
NetworkReceiveBytes_name
Количество байт, полученных через сетевой интерфейс. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server.
NetworkReceiveDrop_name
Количество байт, потерянных при приёме пакетов через сетевой интерфейс. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server.
NetworkReceiveErrors_name
Количество случаев возникновения ошибок при приёме через сетевой интерфейс. Это системная метрика, она включает все процессы на хостовой машине, а не только clickhouse-server.
NetworkReceivePackets_name
Количество сетевых пакетов, полученных через сетевой интерфейс. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.
NetworkSendBytes_name
Количество байт, отправленных через сетевой интерфейс. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.
NetworkSendDrop_name
Количество случаев, когда пакет был отброшен при отправке через сетевой интерфейс. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.
NetworkSendErrors_name
Количество случаев возникновения ошибки (например, повторная передача TCP) при отправке через сетевой интерфейс. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.
NetworkSendPackets_name
Количество сетевых пакетов, отправленных через сетевой интерфейс. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.
NumberOfDatabases
Общее количество баз данных на сервере.
NumberOfDetachedByUserParts
Общее количество частей, отделённых от таблиц MergeTree пользователями с помощью запроса ALTER TABLE DETACH (в отличие от неожиданных, повреждённых или игнорируемых частей). Сервер не отслеживает отделённые части, и их можно удалить.
NumberOfDetachedParts
Общее количество частей, отделённых от таблиц MergeTree. Часть может быть отделена пользователем с помощью запроса ALTER TABLE DETACH или самим сервером, если часть повреждена, неожиданна или не нужна. Сервер не отслеживает отделённые части, и их можно удалить.
NumberOfTables
Общее количество таблиц, суммированное по всем базам данных на сервере, за исключением баз данных, которые не могут содержать таблицы MergeTree. Исключены движки баз данных, которые формируют набор таблиц «на лету», такие как Lazy, MySQL, PostgreSQL, SQlite.
OSContextSwitches
Количество переключений контекста, которые произошли в системе на хостовой машине. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.
OSGuestNiceTime
Доля времени, затраченного на работу виртуального CPU для гостевых операционных систем под управлением ядра Linux, когда для гостя был установлен более высокий приоритет (см. man procfs). Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но присутствует для полноты. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSGuestNiceTimeCPU_N
Доля времени, затраченного на работу виртуального CPU для гостевых операционных систем под управлением ядра Linux, когда для гостя был установлен более высокий приоритет (см. man procfs). Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но присутствует для полноты. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSGuestNiceTimeNormalized
Значение аналогично OSGuestNiceTime, но поделено на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если число ядер неоднородно, и всё равно получать среднюю метрику использования ресурсов.
OSGuestTime
Доля времени, затраченного на работу виртуального CPU для гостевых операционных систем под управлением ядра Linux (см. man procfs). Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но присутствует для полноты. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..количество ядер].
OSGuestTimeCPU_N
Отношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под управлением ядра Linux (см. man procfs). Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но приведена для полноты. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма [0..num cores].
OSGuestTimeNormalized
Значение аналогично OSGuestTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от их числа. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере даже при неодинаковом количестве ядер и при этом получать среднюю метрику использования ресурсов.
OSIOWaitTime
Отношение времени, в течение которого ядро CPU не выполняло код, но при этом ядро ОС не запускало на этом CPU никакой другой процесс, так как процессы ожидали I/O. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма [0..num cores].
OSIOWaitTimeCPU_N
Отношение времени, в течение которого ядро CPU не выполняло код, но при этом ядро ОС не запускало на этом CPU никакой другой процесс, так как процессы ожидали I/O. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма [0..num cores].
OSIOWaitTimeNormalized
Значение аналогично OSIOWaitTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от их числа. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере даже при неодинаковом количестве ядер и при этом получать среднюю метрику использования ресурсов.
OSIdleTime
Отношение времени, в течение которого ядро CPU простаивало (даже не было готово выполнить процесс, ожидающий I/O) с точки зрения ядра ОС. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Она не включает время, когда CPU был недоиспользован по причинам, внутренним для самого CPU (загрузки памяти, простои конвейера, ошибочные предсказания переходов, выполнение другого SMT-ядра). Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма [0..num cores].
OSIdleTimeCPU_N
Отношение времени, в течение которого ядро CPU простаивало (даже не было готово выполнить процесс, ожидающий I/O) с точки зрения ядра ОС. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Она не включает время, когда CPU был недоиспользован по причинам, внутренним для самого CPU (загрузки памяти, простои конвейера, ошибочные предсказания переходов, выполнение другого SMT-ядра). Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма [0..num cores].
OSIdleTimeNormalized
Значение аналогично OSIdleTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от их числа. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере даже при неодинаковом количестве ядер и при этом получать среднюю метрику использования ресурсов.
OSInterrupts
Количество прерываний на хостовой машине. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server.
OSIrqTime
Отношение времени, затраченного на обработку аппаратных прерываний на CPU. Это системная метрика: она включает все процессы на хостовой машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на некорректную конфигурацию оборудования или очень высокую сетевую нагрузку. Значение для одного ядра CPU находится в интервале [0..1]. Значение для всех ядер CPU вычисляется как их сумма [0..num cores].
OSIrqTimeCPU_N
Доля времени, затраченного на обработку аппаратных прерываний на CPU. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server. Высокое значение этой метрики может указывать на некорректную конфигурацию оборудования или очень высокую сетевую нагрузку. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].
OSIrqTimeNormalized
Значение аналогично OSIrqTime, но поделено на количество ядер CPU, чтобы укладываться в интервал [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер различается, и при этом получать усреднённую метрику использования ресурсов.
OSMemoryAvailable
Объём памяти, доступной для использования программами, в байтах. Эта метрика очень похожа на OSMemoryFreePlusCached. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.
OSMemoryBuffers
Объём памяти, используемой буферами ядра ОС, в байтах. Обычно это значение должно быть небольшим, а большие значения могут указывать на некорректную конфигурацию ОС. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.
OSMemoryCached
Объём памяти, используемой страничным кэшем ОС, в байтах. Как правило, почти вся доступная память используется страничным кэшем ОС — высокие значения этой метрики являются нормальными и ожидаемыми. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.
OSMemoryFreePlusCached
Объём свободной памяти плюс память страничного кэша ОС на хост-системе, в байтах. Эта память доступна для использования программами. Значение должно быть очень близко к OSMemoryAvailable. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.
OSMemoryFreeWithoutCached
Объём свободной памяти на хост-системе, в байтах. Это значение не включает память, используемую страничным кэшем ОС. Память страничного кэша также доступна для использования программами, поэтому значение этой метрики может быть неоднозначным. Вместо неё см. метрику OSMemoryAvailable. Для удобства также предоставляется метрика OSMemoryFreePlusCached, которая должна быть примерно аналогична OSMemoryAvailable. См. также https://www.linuxatemyram.com/. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.
OSMemoryTotal
Общий объём памяти на хост-системе, в байтах.
OSNiceTime
Доля времени, когда ядро CPU выполняло пользовательский код с повышенным приоритетом. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].
OSNiceTimeCPU_N
Доля времени, когда указанное ядро CPU выполняло пользовательский код с повышенным приоритетом. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].
OSNiceTimeNormalized
Значение аналогично OSNiceTime, но поделено на количество ядер CPU, чтобы укладываться в интервал [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер различается, и при этом получать усреднённую метрику использования ресурсов.
OSOpenFiles
Общее количество открытых файлов на хост-системе. Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.
OSProcessesBlocked
Количество потоков, заблокированных в ожидании завершения операций ввода-вывода (man procfs). Это системная метрика: она включает все процессы на хост-системе, а не только clickhouse-server.
OSProcessesCreated
Количество созданных процессов. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.
OSProcessesRunning
Количество потоков, которые могут выполняться (запущены или готовы к запуску), по данным операционной системы. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server.
OSSoftIrqTime
Доля времени, затраченного на обработку программных запросов прерываний на CPU. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективно работающее программное обеспечение в системе. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].
OSSoftIrqTimeCPU_N
Доля времени, затраченного на обработку программных запросов прерываний на CPU. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективно работающее программное обеспечение в системе. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].
OSSoftIrqTimeNormalized
Значение аналогично OSSoftIrqTime, но разделено на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер отличается, и при этом получать усреднённую метрику использования ресурсов.
OSStealTime
Доля времени, которое CPU проводит в других операционных системах при работе в виртуализованной среде. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Не все виртуализованные среды предоставляют эту метрику, и большинство — нет. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].
OSStealTimeCPU_N
Доля времени, которое CPU проводит в других операционных системах при работе в виртуализованной среде. Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Не все виртуализованные среды предоставляют эту метрику, и большинство — нет. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].
OSStealTimeNormalized
Значение аналогично OSStealTime, но разделено на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер отличается, и при этом получать усреднённую метрику использования ресурсов.
OSSystemTime
Доля времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].
OSSystemTimeCPU_N
Доля времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика на уровне всей системы, она включает все процессы на хостовой машине, а не только clickhouse-server. Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..количество ядер].
OSSystemTimeNormalized
Значение аналогично OSSystemTime, но разделено на количество ядер CPU, чтобы измеряться в интервале [0..1] независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер отличается, и при этом получать усреднённую метрику использования ресурсов.
OSThreadsRunnable
Общее количество потоков в состоянии «runnable», как его видит планировщик ядра ОС.
OSThreadsTotal
Общее количество потоков, с точки зрения планировщика ядра ОС.
OSUptime
Время непрерывной работы хост-сервера (машины, на которой запущен ClickHouse), в секундах.
OSUserTime
Доля времени, когда ядро CPU выполняло пользовательский код (userspace). Это метрика для всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Сюда также входит время, когда CPU был недоиспользован по причинам, внутренним для самого CPU (загрузки из памяти, остановки конвейера, ошибочные предсказания переходов, выполнение другого SMT-ядра). Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..число ядер].
OSUserTimeCPU_N
Доля времени, когда ядро CPU выполняло пользовательский код (userspace). Это метрика для всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Сюда также входит время, когда CPU был недоиспользован по причинам, внутренним для самого CPU (загрузки из памяти, остановки конвейера, ошибочные предсказания переходов, выполнение другого SMT-ядра). Значение для одного ядра CPU лежит в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по всем ядрам [0..число ядер].
OSUserTimeNormalized
Значение аналогично OSUserTime, но делится на количество ядер CPU, чтобы оставаться в интервале [0..1] независимо от числа ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если число ядер неоднородно, и при этом получать корректную усреднённую метрику использования ресурсов.
PostgreSQLThreads
Количество потоков в сервере протокола совместимости с PostgreSQL.
ReplicasMaxAbsoluteDelay
Максимальная разница в секундах между самой свежей реплицированной частью и самой свежей частью данных, ещё не реплицированной, по всем Replicated-таблицам. Очень большое значение указывает на реплику без данных.
ReplicasMaxInsertsInQueue
Максимальное количество операций INSERT в очереди (ещё не реплицированных) по всем Replicated-таблицам.
ReplicasMaxMergesInQueue
Максимальное количество операций слияния в очереди (ещё не применённых) по всем Replicated-таблицам.
ReplicasMaxQueueSize
Максимальный размер очереди (по количеству операций типа get, merge) по всем Replicated-таблицам.
ReplicasMaxRelativeDelay
Максимальная разница между задержкой реплики и задержкой самой актуальной реплики той же таблицы по всем Replicated-таблицам.
ReplicasSumInsertsInQueue
Суммарное количество операций INSERT в очереди (ещё не реплицированных) по всем Replicated-таблицам.
ReplicasSumMergesInQueue
Суммарное количество операций слияния в очереди (ещё не применённых) по всем Replicated-таблицам.
ReplicasSumQueueSize
Суммарный размер очереди (по количеству операций типа get, merge) по всем Replicated-таблицам.
TCPThreads
Количество потоков в сервере протокола TCP (без TLS).
Temperature_N
Температура соответствующего устройства в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/thermal
Temperature_name
Температура, сообщаемая соответствующим аппаратным монитором и соответствующим датчиком, в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/hwmon
TotalBytesOfMergeTreeTables
Общее количество байт (сжатых, включая данные и индексы), хранящихся во всех таблицах семейства MergeTree.
TotalPartsOfMergeTreeTables
Общее количество частей данных во всех таблицах семейства MergeTree. Значения больше 10 000 будут отрицательно влиять на время запуска сервера и могут указывать на неудачный выбор ключа партиционирования.
TotalPrimaryKeyBytesInMemory
Объём памяти (в байтах), используемой значениями первичного ключа (учитываются только активные части).
TotalPrimaryKeyBytesInMemoryAllocated
Объём памяти (в байтах), зарезервированной под значения первичного ключа (учитываются только активные части).
TotalRowsOfMergeTreeTables
Общее количество строк (записей), хранимых во всех таблицах семейства MergeTree.
Uptime
Время работы сервера в секундах. Включает время, затраченное на инициализацию сервера до начала приёма подключений.
jemalloc.active
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.allocated
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.dirty_purged
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.muzzy_purged
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pactive
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pdirty
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pmuzzy
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_runs
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_threads
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.run_intervals
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.epoch
Внутренний инкрементальный номер обновления статистики jemalloc (распределителя памяти Джейсона Эванса), используемый во всех остальных метриках jemalloc.
jemalloc.mapped
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.metadata
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.metadata_thp
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.resident
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.retained
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.prof.active
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
См. также
- Monitoring — Базовые концепции мониторинга ClickHouse.
- system.metrics — Содержит мгновенно вычисляемые метрики.
- system.events — Содержит количество произошедших событий.
- system.metric_log — Содержит историю значений метрик из таблиц
system.metricsиsystem.events.