Табличная функция deltaLakeCluster
Это расширение табличной функции deltaLake.
Позволяет параллельно обрабатывать файлы из таблиц Delta Lake в Amazon S3 одновременно с нескольких узлов заданного кластера. На инициаторе создаётся подключение ко всем узлам в кластере, и каждый файл динамически распределяется между ними. Рабочий узел запрашивает у инициатора следующую задачу и обрабатывает её. Это повторяется до тех пор, пока все задачи не будут выполнены.
Синтаксис
deltaLakeS3Cluster — это псевдоним deltaLakeCluster, оба используются с S3.
Аргументы
-
cluster_name— имя кластера, которое используется для формирования набора адресов и параметров подключения к удалённым и локальным серверам. -
Описание всех остальных аргументов аналогично описанию аргументов в эквивалентной табличной функции deltaLake.
Возвращаемое значение
Таблица с указанной структурой для чтения данных с кластера из указанной таблицы Delta Lake в S3.
Виртуальные столбцы
_path— путь к файлу. Тип:LowCardinality(String)._file— имя файла. Тип:LowCardinality(String)._size— размер файла в байтах. Тип:Nullable(UInt64). Если размер файла неизвестен, значение —NULL._time— время последнего изменения файла. Тип:Nullable(DateTime). Если время неизвестно, значение —NULL._etag— ETag файла. Тип:LowCardinality(String). Если ETag неизвестен, значение —NULL.