groupArrayResample
Описание
Комбинатор Resample
может быть применён к агрегатной функции groupArray,
чтобы разделить диапазон заданного ключевого столбца на фиксированное количество интервалов (N)
и сформировать результирующий массив, выбирая по одному представительному значению
(соответствующему минимальному ключу) из точек данных, попадающих в каждый интервал.
Он формирует укрупнённое (downsampled) представление данных вместо сбора всех значений.
Пример использования
Рассмотрим пример. Мы создадим таблицу, содержащую столбцы name, age и
wage сотрудников, и вставим в неё некоторые данные:
Получим имена людей, возраст которых лежит в интервалах [30,60)
и [60,75). Поскольку мы используем целочисленное представление возраста, мы получаем значения возраста в интервалах
[30, 59] и [60,74].
Чтобы агрегировать имена в массив, используем агрегатную функцию groupArray.
Она принимает один аргумент. В нашем случае это столбец с именем. Функция groupArrayResample
должна использовать столбец с возрастом, чтобы агрегировать имена по возрасту. Чтобы задать
необходимые интервалы, передаём 30, 75, 30 в качестве аргументов функции groupArrayResample: