Мониторинг

Примечание

Данные мониторинга, описанные в данном руководстве, доступны в ClickHouse Cloud. Помимо отображения во встроенной панели, описанной ниже, как базовые, так и расширенные метрики производительности можно просматривать непосредственно в основной консоли сервиса.

Вы можете отслеживать:

Использование аппаратных ресурсов.
Метрики сервера ClickHouse.

Встроенная расширенная панель наблюдаемости

ClickHouse включает встроенную расширенную панель наблюдаемости, доступную по адресу $HOST:$PORT/dashboard (требуются имя пользователя и пароль). На ней отображаются следующие метрики:

Число запросов в секунду
Использование CPU (ядра)
Количество выполняющихся запросов
Количество выполняющихся слияний
Выборка байт в секунду
Ожидание I/O
Ожидание CPU
Использование CPU ОС (userspace)
Использование CPU ОС (kernel)
Объём чтения с диска
Объём чтения из файловой системы
Память (отслеживаемая)
Число вставленных строк в секунду
Общее количество частей MergeTree
Максимальное количество частей на раздел

Использование ресурсов

ClickHouse также самостоятельно отслеживает состояние аппаратных ресурсов, таких как:

Нагрузка и температура процессоров.
Использование системы хранения, оперативной памяти и сети.

Эти данные собираются в таблице system.asynchronous_metric_log.

Метрики сервера ClickHouse

Сервер ClickHouse имеет встроенные средства для мониторинга собственного состояния.

Для отслеживания событий сервера используйте журналы сервера. См. раздел logger в файле конфигурации.

ClickHouse собирает:

Различные метрики использования сервером вычислительных ресурсов.
Общую статистику по обработке запросов.

Вы можете найти метрики в таблицах system.metrics, system.events и system.asynchronous_metrics.

Вы можете настроить ClickHouse на экспорт метрик в Graphite. См. раздел Graphite в файле конфигурации сервера ClickHouse. Перед настройкой экспорта метрик необходимо развернуть Graphite, следуя их официальному руководству.

Вы можете настроить ClickHouse на экспорт метрик в Prometheus. См. раздел Prometheus в файле конфигурации сервера ClickHouse. Перед настройкой экспорта метрик необходимо развернуть Prometheus, следуя их официальному руководству.

Кроме того, вы можете мониторить доступность сервера через HTTP API. Отправьте запрос HTTP GET к /ping. Если сервер доступен, он отвечает 200 OK.

Для мониторинга серверов в конфигурации кластера необходимо задать параметр max_replica_delay_for_distributed_queries и использовать HTTP-ресурс /replicas_status. Запрос к /replicas_status возвращает 200 OK, если реплика доступна и не отстаёт от других реплик. Если реплика отстаёт, возвращается 503 HTTP_SERVICE_UNAVAILABLE с информацией о величине отставания.

Встроенная расширенная панель наблюдаемости​

Использование ресурсов​

Метрики сервера ClickHouse​

Встроенная расширенная панель наблюдаемости

Использование ресурсов

Метрики сервера ClickHouse