Агрегатные функции

ClickHouse поддерживает все стандартные агрегатные функции SQL (sum, avg, min, max, count), а также широкий набор других агрегатных функций.

Страница	Описание
aggThrow	Эта функция может использоваться для проверки гарантий безопасности при возникновении исключений. При создании она будет выбрасывать исключение с указанной вероятностью.
analysisOfVariance	Предоставляет статистический тест для однофакторного дисперсионного анализа (тест ANOVA). Это тест для нескольких групп нормально распределённых наблюдений, позволяющий определить, имеют ли все группы одинаковое среднее значение или нет.
any	Возвращает первое встреченное значение в столбце.
anyHeavy	Выбирает часто встречающееся значение с использованием алгоритма «heavy hitters». Если существует значение, которое более чем в половине случаев встречается в каждом потоке выполнения запроса, возвращается именно оно. Обычно результат не детерминирован.
anyLast	Выбирает последнее встретившееся значение столбца.
approx_top_k	Возвращает массив приблизительно наиболее частых значений и количества их вхождений в указанном столбце.
approx_top_sum	Возвращает массив приблизительно наиболее часто встречающихся значений и их количеств в указанном столбце.
argMax	Вычисляет значение `arg`, соответствующее максимальному значению `val`.
argMin	Вычисляет значение `arg` для минимального значения `val`. Если существует несколько строк с одинаковым минимальным значением `val`, то то, какое из соответствующих значений `arg` будет возвращено, не является детерминированным.
argAndMax	Вычисляет значения `arg` и `val` для максимального значения `val`. Если существует несколько строк с одинаковым максимальным значением `val`, то то, какие из соответствующих `arg` и `val` будут возвращены, не определено.
argAndMin	Вычисляет значения `arg` и `val` для минимального значения `val`. Если существует несколько строк с одинаковым минимальным значением `val`, то какие именно из соответствующих значений `arg` и `val` будут возвращены, не гарантируется.
groupArrayArray	Объединяет массивы в один массив массивов.
avg	Вычисляет среднее арифметическое.
avgWeighted	Вычисляет взвешенное арифметическое среднее.
boundingRatio	Агрегатная функция, вычисляющая наклон между самой левой и самой правой точками в группе значений.
categoricalInformationValue	Вычисляет значение `(P(tag = 1) - P(tag = 0))(log(P(tag = 1)) - log(P(tag = 0)))` для каждой категории.
contingency	Функция `contingency` вычисляет коэффициент сопряжённости — значение, которое измеряет степень связи между двумя столбцами в таблице. Вычисление аналогично функции `cramersV`, но использует другой знаменатель в выражении под знаком квадратного корня.
corr	Вычисляет коэффициент корреляции Пирсона.
corrMatrix	Вычисляет матрицу корреляции для N переменных.
corrStable	Вычисляет коэффициент корреляции Пирсона, используя численно устойчивый алгоритм.
count	Подсчитывает количество строк или значений, отличных от NULL.
covarPop	Вычисляет ковариацию по генеральной совокупности
covarPopMatrix	Возвращает матрицу ковариаций генеральной совокупности для N переменных.
covarPopStable	Вычисляет ковариацию генеральной совокупности
covarSamp	Вычисляет значение выражения `Σ((x - x̅)(y - y̅)) / (n - 1)`
covarSampMatrix	Возвращает выборочную ковариационную матрицу для N переменных.
covarSampStable	Аналогична `covarSamp`, но работает медленнее при меньшей вычислительной погрешности.
cramersV	Результат функции `cramersV` лежит в диапазоне от 0 (что соответствует отсутствию связи между переменными) до 1 и может достигать 1 только в том случае, если каждое значение полностью определяется другим. Эту величину можно рассматривать как меру связи между двумя переменными, выраженную в процентах от их максимально возможной вариации.
cramersVBiasCorrected	Вычисляет V Крамера, но с поправкой на смещение.
deltaSum	Суммирует арифметическую разность между соседними строками.
deltaSumTimestamp	Вычисляет разности между соседними строками и суммирует их. Отрицательные разности игнорируются.
entropy	Вычисляет энтропию Шеннона для столбца значений.
estimateCompressionRatio	Оценивает коэффициент сжатия для заданного столбца, не выполняя его сжатие.
exponentialMovingAverage	Вычисляет экспоненциальное скользящее среднее значений за заданный интервал времени.
exponentialTimeDecayedAvg	Возвращает экспоненциально сглаженное взвешенное скользящее среднее значений временного ряда в момент времени `t`.
exponentialTimeDecayedCount	Возвращает накопленное экспоненциальное затухание для временного ряда в момент времени с индексом `t`.
exponentialTimeDecayedMax	Возвращает максимум из значений вычисленного экспоненциально сглаженного скользящего среднего во времени: в момент с индексом `t` и в момент `t-1`.
exponentialTimeDecayedSum	Возвращает сумму значений экспоненциально сглаженного скользящего среднего временного ряда в момент времени `t`.
first_value	Это псевдоним для any, но он был добавлен для совместимости с Window Functions, где иногда требуется обрабатывать значения `NULL` (по умолчанию все агрегатные функции ClickHouse игнорируют значения `NULL`).
flameGraph	Агрегатная функция, строящая флеймграф по списку трассировок стека.
groupArray	Создаёт массив значений аргументов. Значения могут добавляться в массив в произвольном (неопределённом) порядке.
groupArrayInsertAt	Вставляет значение в массив на указанную позицию.
groupArrayIntersect	Возвращает пересечение заданных массивов (все элементы, которые присутствуют во всех этих массивах).
groupArrayLast	Создает массив из значений последнего аргумента.
groupArrayMovingAvg	Вычисляет скользящее среднее для входных значений.
groupArrayMovingSum	Вычисляет скользящую сумму входных значений.
groupArraySample	Создает массив примеров значений аргумента. Размер результирующего массива ограничен `max_size` элементами. Значения аргумента выбираются и добавляются в массив случайным образом.
groupArraySorted	Возвращает массив из первых N элементов, упорядоченных по возрастанию.
timeSeriesGroupArray	Сортирует временные ряды по метке времени в порядке возрастания.
groupBitAnd	Применяет операцию побитового `AND` к последовательности чисел.
groupBitmap	Выполняет bitmap- или агрегатные вычисления по беззнаковому целочисленному столбцу, возвращает мощность множества в виде значения типа UInt64, а при добавлении суффикса -State возвращает объект bitmap
groupBitmapAnd	Выполняет побитовую операцию AND над bitmap-столбцом, возвращает кардинальность множества в виде значения типа UInt64; если добавить суффикс -State, то возвращает bitmap-объект.
groupBitmapOr	Вычисляет логическое ИЛИ по битмап-столбцу и возвращает кардинальность типа UInt64; при добавлении суффикса -State возвращает объект битмапа. Эквивалентна функции `groupBitmapMerge`.
groupBitmapXor	Вычисляет XOR битового столбца и возвращает кардинальность (cardinality) типа UInt64; если используется с суффиксом -State, то возвращает объект битовой карты
groupBitOr	Применяет побитовую операцию `OR` к последовательности чисел.
groupBitXor	Применяет побитовую операцию `XOR` к последовательности чисел.
groupUniqArray	Создаёт массив из значений переданных аргументов.
intervalLengthSum	Вычисляет общую длину объединения всех диапазонов (отрезков на числовой прямой).
kolmogorovSmirnovTest	Применяет критерий Колмогорова–Смирнова к выборкам из двух распределений.
kurtPop	Вычисляет эксцесс для последовательности.
kurtSamp	Вычисляет выборочный эксцесс для последовательности.
largestTriangleThreeBuckets	Применяет алгоритм «Largest-Triangle-Three-Buckets» к входным данным.
last_value	Выбирает последнее встретившееся значение, аналогично `anyLast`, но допускает значение NULL.
mannWhitneyUTest	Применяет ранговый критерий Манна — Уитни к выборкам из двух генеральных совокупностей.
max	Агрегатная функция, вычисляющая максимум по группе значений.
maxIntersections	Агрегатная функция, вычисляющая максимальное количество одновременных пересечений в группе интервалов (при условии, что все интервалы пересекаются хотя бы один раз).
maxIntersectionsPosition	Агрегатная функция, вычисляющая позиции вхождений функции maxIntersections.
maxMap	Вычисляет максимальное значение в массиве `value` по ключам, указанным в массиве `key`.
meanZTest	Применяет z‑критерий для сравнения средних по выборкам из двух генеральных совокупностей.
median	Функции `median` являются псевдонимами соответствующих функций `quantile`. Они вычисляют медиану выборки числовых данных.
min	Агрегатная функция, вычисляющая минимальное значение по группе значений.
minMap	Вычисляет минимальное значение из массива `value` по ключам, указанным в массиве `key`.
quantile	Вычисляет приближённый квантиль последовательности числовых данных.
quantileBFloat16	Вычисляет приближённый квантиль выборки, состоящей из чисел типа bfloat16.
quantileDD	Вычисляет приближённый квантиль выборки с гарантированной относительной погрешностью.
quantileDeterministic	Вычисляет приближённое значение квантили для числовой последовательности данных.
Функции quantileExact	функции quantileExact, quantileExactLow, quantileExactHigh, quantileExactExclusive, quantileExactInclusive
quantileExactWeighted	Точно вычисляет квантиль последовательности числовых данных с учетом веса каждого значения.
quantileGK	Вычисляет квантиль числовой последовательности данных с использованием алгоритма Гринвальда — Ханны (Greenwald-Khanna).
quantileExactWeightedInterpolated	Вычисляет квантиль последовательности числовых данных с использованием линейной интерполяции с учётом веса каждого элемента.
quantileInterpolatedWeighted	Вычисляет квантиль последовательности числовых данных с использованием линейной интерполяции с учётом веса каждого элемента.
Функции quantiles	quantiles, quantilesExactExclusive, quantilesExactInclusive, quantilesGK
quantileTDigest	Вычисляет приближённый квантиль последовательности числовых данных с помощью алгоритма t-digest.
quantileTDigestWeighted	Вычисляет приближённый квантиль по числовой последовательности данных на основе алгоритма t-digest.
quantileTiming	Вычисляет квантиль числовой последовательности данных с заданной точностью.
quantileTimingWeighted	С заданной точностью вычисляет квантиль числовой последовательности с учётом веса каждого её элемента.
rankCorr	Вычисляет коэффициент ранговой корреляции.
simpleLinearRegression	Выполняет простую (одномерную) линейную регрессию.
singleValueOrNull	Агрегатная функция `singleValueOrNull` используется для реализации операторов с подзапросами, таких как `x = ALL (SELECT ...)`. Она проверяет, есть ли в данных ровно одно уникальное значение, отличное от NULL.
skewPop	Вычисляет коэффициент асимметрии последовательности.
skewSamp	Вычисляет выборочный коэффициент асимметрии последовательности.
sparkbar	Функция строит гистограмму частот для значений `x` и их частоты повторения `y` на интервале `[min_x, max_x]`.
stddevPop	Результат равен квадратному корню из varPop.
stddevPopStable	Результат равен квадратному корню из varPop. В отличие от stddevPop, эта функция использует численно стабильный алгоритм.
stddevSamp	Результат равен квадратному корню результата функции varSamp
stddevSampStable	Результат равен квадратному корню из результата varSamp. В отличие от функции varSamp, эта функция использует численно устойчивый алгоритм.
stochasticLinearRegression	Эта функция реализует стохастическую линейную регрессию. Она поддерживает пользовательские параметры для скорости обучения, коэффициента L2-регуляризации, размера мини-батча и несколько методов обновления весов (Adam, простой SGD, Momentum, Nesterov).
stochasticLogisticRegression	Эта функция реализует стохастическую логистическую регрессию. Она может использоваться для решения задачи бинарной классификации, поддерживает те же настраиваемые параметры, что и stochasticLinearRegression, и работает аналогичным образом.
studentTTest	Применяет t-критерий Стьюдента к выборкам из двух генеральных совокупностей.
studentTTestOneSample	Применяет одновыборочный t-критерий Стьюдента к выборке и известному среднему значению генеральной совокупности.
sum	Вычисляет сумму. Применимо только к числам.
sumCount	Вычисляет сумму чисел и одновременно считает количество строк. Функция используется оптимизатором запросов ClickHouse: если в запросе присутствует несколько функций `sum`, `count` или `avg`, их можно заменить одной функцией `sumCount`, чтобы повторно использовать результаты вычислений. Функцию редко требуется вызывать напрямую.
sumKahan	Вычисляет сумму чисел с использованием алгоритма компенсированного суммирования Кэхэна
sumMap	Суммирует один или несколько массивов `value` в соответствии с ключами из массива `key`. Возвращает кортеж массивов: ключи в отсортированном порядке, далее значения, просуммированные для соответствующих ключей без переполнения.
sumMapWithOverflow	Подсчитывает сумму элементов массива `value` с учётом ключей, указанных в массиве `key`. Возвращает кортеж из двух массивов: ключи в отсортированном порядке и значения, просуммированные для соответствующих ключей. Отличается от функции sumMap тем, что выполняет суммирование с переполнением.
sumWithOverflow	Вычисляет сумму чисел, используя для результата тот же тип данных, что и для входных параметров. Если сумма превышает максимальное значение для этого типа данных, она вычисляется с переполнением.
theilsU	Функция `theilsU` вычисляет коэффициент неопределённости U Тейла — показатель, характеризующий взаимосвязь между двумя столбцами в таблице.
topK	Возвращает массив приблизительно наиболее часто встречающихся значений в указанном столбце. Полученный массив упорядочен по убыванию их приблизительной частоты (а не по самим значениям).
topKWeighted	Возвращает массив примерно наиболее часто встречающихся значений в указанном столбце. Полученный массив отсортирован по убыванию примерной частоты значений (а не по самим значениям). При этом учитывается вес значения.
uniq	Вычисляет примерное количество уникальных значений аргумента.
uniqCombined	Вычисляет приблизительное число различных значений аргумента.
uniqCombined64	Вычисляет приблизительное количество различных значений аргумента. Аналогична uniqCombined, но использует 64-битный хэш для всех типов данных, а не только для String.
uniqExact	Вычисляет точное количество различных значений аргумента.
uniqHLL12	Вычисляет приблизительное количество различных значений аргумента с использованием алгоритма HyperLogLog.
uniqTheta	Вычисляет приблизительное количество различных значений аргумента с использованием фреймворка Theta Sketch.
varPop	Вычисляет генеральную дисперсию.
varPopStable	Возвращает генеральную дисперсию. В отличие от varPop, эта функция использует численно устойчивый алгоритм. Она работает медленнее, но даёт меньшую вычислительную погрешность.
varSamp	Вычисляет выборочную дисперсию набора данных.
varSampStable	Вычисляет выборочную дисперсию набора данных. В отличие от `varSamp`, эта функция использует численно устойчивый алгоритм. Работает медленнее, но обеспечивает меньшую вычислительную погрешность.
welchTTest	Применяет t‑критерий Уэлча к выборкам из двух совокупностей.
distinctDynamicTypes	Вычисляет список уникальных типов данных, хранящихся в столбце Dynamic.
distinctJSONPaths	Вычисляет список уникальных путей, хранящихся в JSON-столбце.
timeSeriesDeltaToGrid	Агрегатная функция, вычисляющая дельту в стиле PromQL для данных временных рядов на заданной сетке.
timeSeriesInstantDeltaToGrid	Агрегатная функция, вычисляющая PromQL-подобный idelta для данных временных рядов на заданной сетке.
timeSeriesInstantRateToGrid	Агрегатная функция, вычисляющая PromQL‑подобный irate для данных временных рядов на заданной временной сетке.
timeSeriesLastTwoSamples	Агрегатная функция для ресемплирования временных рядов при вычислении функций irate и idelta по аналогии с PromQL
timeSeriesRateToGrid	Агрегирующая функция, вычисляющая PromQL-подобный rate по данным временных рядов на заданной временной сетке.
timeSeriesResampleToGridWithStaleness	Агрегатная функция для ресемплирования данных временных рядов по заданной временной сетке.
timeSeriesDerivToGrid	Агрегатная функция, вычисляющая производную, аналогичную PromQL, по данным временных рядов на заданной сетке.
timeSeriesPredictLinearToGrid	Агрегатная функция, вычисляющая линейный прогноз по данным временных рядов в стиле PromQL на заданной сетке.
timeSeriesChangesToGrid	Агрегатная функция, вычисляющая изменения в данных временных рядов в стиле PromQL на заданной временной сетке.
timeSeriesResetsToGrid	Агрегатная функция, вычисляющая сбросы в стиле PromQL по данным временных рядов на заданной сетке.
groupConcat	Вычисляет строку, полученную конкатенацией группы строк, с необязательным разделителем и необязательным ограничением на максимальное число элементов.
quantilePrometheusHistogram	Вычисляет квантиль по гистограмме с помощью линейной интерполяции.