Мониторинг
Данные мониторинга, описанные в данном руководстве, доступны в ClickHouse Cloud. Помимо отображения во встроенной панели, описанной ниже, как базовые, так и расширенные метрики производительности можно просматривать непосредственно в основной консоли сервиса.
Вы можете отслеживать:
- Использование аппаратных ресурсов.
- Метрики сервера ClickHouse.
Встроенная расширенная панель наблюдаемости
ClickHouse включает встроенную расширенную панель наблюдаемости, доступную по адресу $HOST:$PORT/dashboard (требуются имя пользователя и пароль). На ней отображаются следующие метрики:
- Число запросов в секунду
- Использование CPU (ядра)
- Количество выполняющихся запросов
- Количество выполняющихся слияний
- Выборка байт в секунду
- Ожидание I/O
- Ожидание CPU
- Использование CPU ОС (userspace)
- Использование CPU ОС (kernel)
- Объём чтения с диска
- Объём чтения из файловой системы
- Память (отслеживаемая)
- Число вставленных строк в секунду
- Общее количество частей MergeTree
- Максимальное количество частей на раздел
Использование ресурсов
ClickHouse также самостоятельно отслеживает состояние аппаратных ресурсов, таких как:
- Нагрузка и температура процессоров.
- Использование системы хранения, оперативной памяти и сети.
Эти данные собираются в таблице system.asynchronous_metric_log.
Метрики сервера ClickHouse
Сервер ClickHouse имеет встроенные средства для мониторинга собственного состояния.
Для отслеживания событий сервера используйте журналы сервера. См. раздел logger в файле конфигурации.
ClickHouse собирает:
- Различные метрики использования сервером вычислительных ресурсов.
- Общую статистику по обработке запросов.
Вы можете найти метрики в таблицах system.metrics, system.events и system.asynchronous_metrics.
Вы можете настроить ClickHouse на экспорт метрик в Graphite. См. раздел Graphite в файле конфигурации сервера ClickHouse. Перед настройкой экспорта метрик необходимо развернуть Graphite, следуя их официальному руководству.
Вы можете настроить ClickHouse на экспорт метрик в Prometheus. См. раздел Prometheus в файле конфигурации сервера ClickHouse. Перед настройкой экспорта метрик необходимо развернуть Prometheus, следуя их официальному руководству.
Кроме того, вы можете мониторить доступность сервера через HTTP API. Отправьте запрос HTTP GET к /ping. Если сервер доступен, он отвечает 200 OK.
Для мониторинга серверов в конфигурации кластера необходимо задать параметр max_replica_delay_for_distributed_queries и использовать HTTP-ресурс /replicas_status. Запрос к /replicas_status возвращает 200 OK, если реплика доступна и не отстаёт от других реплик. Если реплика отстаёт, возвращается 503 HTTP_SERVICE_UNAVAILABLE с информацией о величине отставания.