Перейти к основному содержанию
Перейти к основному содержанию

quantileTDigestWeighted

Вычисляет приближённый квантиль последовательности числовых данных с использованием алгоритма t-digest. Функция учитывает вес каждого элемента последовательности. Максимальная погрешность — 1%. Потребление памяти — log(n), где n — количество значений.

Производительность функции ниже, чем у quantile или quantileTiming. С точки зрения соотношения размера State к точности эта функция значительно лучше, чем quantile.

Результат зависит от порядка выполнения запроса и является недетерминированным.

При использовании нескольких функций quantile* с разными уровнями в одном запросе внутренние состояния не объединяются (то есть запрос работает менее эффективно, чем мог бы). В этом случае используйте функцию quantiles.

:::note
Использование quantileTDigestWeighted не рекомендуется для очень маленьких наборов данных и может приводить к значительной погрешности. В этом случае рассмотрите возможность использования quantileTDigest вместо неё. :::

Синтаксис

quantileTDigestWeighted(level)(expr, weight)

Псевдоним: medianTDigestWeighted.

Аргументы

  • level — Уровень квантиля. Необязательный параметр. Константное число с плавающей запятой от 0 до 1. Рекомендуем использовать значение level в диапазоне [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медиану.
  • expr — Выражение над значениями столбца, результатом которого являются числовые типы данных, Date или DateTime.
  • weight — Столбец с весами элементов последовательности. Вес — это количество вхождений значения.

Возвращаемое значение

  • Приближённый квантиль указанного уровня.

Тип:

  • Float64 для числового типа данных на входе.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Запрос:

SELECT quantileTDigestWeighted(number, 1) FROM numbers(10)

Результат:

┌─quantileTDigestWeighted(number, 1)─┐
│                                4.5 │
└────────────────────────────────────┘

См. также