Перейти к основному содержанию
Перейти к основному содержанию

quantileExactWeightedInterpolated

Вычисляет квантиль числовой последовательности данных с использованием линейной интерполяции с учётом веса каждого элемента.

Для получения интерполированного значения все переданные значения объединяются в массив, который затем сортируется по соответствующим им весам. После этого квантиль интерполируется с помощью метода взвешенного процентиля: по весам строится кумулятивное распределение, затем выполняется линейная интерполяция, использующая веса и значения для вычисления квантилей.

При использовании нескольких функций quantile* с разными уровнями в одном запросе их внутренние состояния не объединяются (то есть запрос работает менее эффективно, чем мог бы). В таком случае используйте функцию quantiles.

Мы настоятельно рекомендуем использовать quantileExactWeightedInterpolated вместо quantileInterpolatedWeighted, поскольку quantileExactWeightedInterpolated обеспечивает более высокую точность, чем quantileInterpolatedWeighted. Ниже приведён пример:

SELECT
    quantileExactWeightedInterpolated(0.99)(number, 1),
    quantile(0.99)(number),
    quantileInterpolatedWeighted(0.99)(number, 1)
FROM numbers(9)
┌─quantileExactWeightedInterpolated(0.99)(number, 1)─┬─quantile(0.99)(number)─┬─quantileInterpolatedWeighted(0.99)(number, 1)─┐
│                                               7.92 │                   7.92 │                                             8 │
└────────────────────────────────────────────────────┴────────────────────────┴───────────────────────────────────────────────┘

Синтаксис

quantileExactWeightedInterpolated(level)(expr, weight)

Псевдоним: medianExactWeightedInterpolated.

Аргументы

  • level — Уровень квантиля. Необязательный параметр. Константное число с плавающей запятой от 0 до 1. Рекомендуется использовать значение level в диапазоне [0.01, 0.99]. Значение по умолчанию: 0.5. При level=0.5 функция вычисляет медиану.
  • expr — Выражение над значениями столбца, результатом которого является числовой тип данных, Date или DateTime.
  • weight — Столбец с весами элементов последовательности. Вес — это количество вхождений значения, представленное беззнаковым целочисленным типом.

Возвращаемое значение

  • Квантиль указанного уровня.

Тип:

  • Float64 для числового типа данных на входе.
  • Date, если входные значения имеют тип Date.
  • DateTime, если входные значения имеют тип DateTime.

Пример

Входная таблица:

┌─n─┬─val─┐
│ 0 │   3 │
│ 1 │   2 │
│ 2 │   1 │
│ 5 │   4 │
└───┴─────┘

Результат:

┌─quantileExactWeightedInterpolated(n, val)─┐
│                                       1.5 │
└───────────────────────────────────────────┘

См. также