Перейти к основному содержанию
Перейти к основному содержанию

Табличные функции remote, remoteSecure

Табличная функция remote позволяет получать доступ к удалённым серверам «на лету», то есть без создания таблицы Distributed. Табличная функция remoteSecure аналогична remote, но использует защищённое соединение.

Обе функции могут использоваться в запросах SELECT и INSERT.

Синтаксис

remote(addresses_expr, [db, table, user [, password], sharding_key])
remote(addresses_expr, [db.table, user [, password], sharding_key])
remote(named_collection[, option=value [,..]])
remoteSecure(addresses_expr, [db, table, user [, password], sharding_key])
remoteSecure(addresses_expr, [db.table, user [, password], sharding_key])
remoteSecure(named_collection[, option=value [,..]])

Параметры

АргументОписание
addresses_exprАдрес удалённого сервера или выражение, генерирующее несколько адресов удалённых серверов. Формат: host или host:port.

host может быть указан как имя сервера либо как IPv4- или IPv6-адрес. Адрес IPv6 должен быть указан в квадратных скобках.

port — это TCP-порт на удалённом сервере. Если порт опущен, используется значение tcp_port из конфигурационного файла сервера для табличной функции remote (по умолчанию 9000) и tcp_port_secure для табличной функции remoteSecure (по умолчанию 9440).

Для IPv6-адресов указание порта обязательно.

Если указан только параметр addresses_expr, по умолчанию для db и table используется system.one.

Тип: String.
dbИмя базы данных. Тип: String.
tableИмя таблицы. Тип: String.
userИмя пользователя. Если не указано, используется default. Тип: String.
passwordПароль пользователя. Если не указан, используется пустой пароль. Тип: String.
sharding_keyКлюч шардирования для распределения данных по узлам. Например: insert into remote('127.0.0.1:9000,127.0.0.2', db, table, 'default', rand()). Тип: UInt32.

Аргументы также могут передаваться с помощью именованных коллекций.

Возвращаемое значение

Таблица, расположенная на удалённом сервере.

Использование

Поскольку табличные функции remote и remoteSecure заново устанавливают соединение для каждого запроса, рекомендуется вместо них использовать таблицу Distributed. Кроме того, если заданы имена хостов, они разрешаются, и ошибки разрешения имён не учитываются при работе с различными репликами. При обработке большого числа запросов всегда создавайте таблицу Distributed заранее и не используйте табличную функцию remote.

Табличная функция remote может быть полезна в следующих случаях:

  • Одноразовая миграция данных из одной системы в другую.
  • Доступ к конкретному серверу для сравнения данных, отладки и тестирования, то есть ad-hoc-подключения.
  • Запросы между различными кластерами ClickHouse в исследовательских целях.
  • Редкие распределённые запросы, выполняемые вручную.
  • Распределённые запросы, для которых набор серверов каждый раз задаётся заново.

Адреса

example01-01-1
example01-01-1:9440
example01-01-1:9000
localhost
127.0.0.1
[::]:9440
[::]:9000
[2a02:6b8:0:1111::11]:9000

Несколько адресов можно указать через запятую. В этом случае ClickHouse будет использовать распределённую обработку и отправит запрос на все указанные адреса (как на шарды с различными данными). Пример:

example01-01-1,example01-02-1

Примеры

Выборка данных с удалённого сервера:

SELECT * FROM remote('127.0.0.1', db.remote_engine_table) LIMIT 3;

Или с использованием именованных коллекций:

CREATE NAMED COLLECTION creds AS
        host = '127.0.0.1',
        database = 'db';
SELECT * FROM remote(creds, table='remote_engine_table') LIMIT 3;

Вставка данных в таблицу на удалённом сервере:

CREATE TABLE remote_table (name String, value UInt32) ENGINE=Memory;
INSERT INTO FUNCTION remote('127.0.0.1', currentDatabase(), 'remote_table') VALUES ('test', 42);
SELECT * FROM remote_table;

Миграция таблиц из одной системы в другую:

В этом примере используется одна таблица из демонстрационного набора данных. База данных — imdb, таблица — actors.

В исходной системе ClickHouse (системе, которая в данный момент хранит данные)

  • Проверьте исходную базу данных и имя таблицы (imdb.actors)

    show databases
    
    show tables in imdb
    
  • Получите инструкцию CREATE TABLE из исходной системы:

  SELECT create_table_query
  FROM system.tables
  WHERE database = 'imdb' AND table = 'actors'

Ответ

CREATE TABLE imdb.actors (`id` UInt32,
                          `first_name` String,
                          `last_name` String,
                          `gender` FixedString(1))
                ENGINE = MergeTree
                ORDER BY (id, first_name, last_name, gender);

На целевой системе ClickHouse

  • Создайте целевую базу данных:

    CREATE DATABASE imdb
    
  • Используя оператор CREATE TABLE из исходной системы, создайте целевую таблицу:

    CREATE TABLE imdb.actors (`id` UInt32,
                              `first_name` String,
                              `last_name` String,
                              `gender` FixedString(1))
                    ENGINE = MergeTree
                    ORDER BY (id, first_name, last_name, gender);
    

Затем на исходном развертывании

Вставьте данные в новую базу данных и таблицу, созданные на удалённой системе. Вам понадобятся хост, порт, имя пользователя, пароль, целевая база данных и целевая таблица.

INSERT INTO FUNCTION
remoteSecure('remote.clickhouse.cloud:9440', 'imdb.actors', 'USER', 'PASSWORD')
SELECT * from imdb.actors

Глоббинг

Шаблоны в фигурных скобках { } используются для генерации набора шардов и для указания реплик. Если фигурных скобок несколько пар, генерируется декартово произведение соответствующих наборов.

Поддерживаются следующие типы шаблонов.

  • {a,b,c} — представляет любую из альтернативных строк a, b или c. Шаблон заменяется на a в адресе первого шарда, на b — во втором и так далее. Например, example0{1,2}-1 генерирует адреса example01-1 и example02-1.
  • {N..M} — диапазон чисел. Этот шаблон генерирует адреса шардов с увеличивающимися индексами от N до M включительно. Например, example0{1..2}-1 генерирует example01-1 и example02-1.
  • {0n..0m} — диапазон чисел с ведущими нулями. Этот шаблон сохраняет ведущие нули в индексах. Например, example{01..03}-1 генерирует example01-1, example02-1 и example03-1.
  • {a|b} — произвольное количество вариантов, разделённых символом |. Шаблон задаёт реплики. Например, example01-{1|2} генерирует реплики example01-1 и example01-2.

Запрос будет отправлен на первую «здоровую» реплику. Однако для remote реплики перебираются в порядке, который в данный момент задан настройкой load_balancing. Число сгенерированных адресов ограничено настройкой table_function_remote_max_addresses.