Перейти к основному содержимому

Обзор типов таблиц

При создании таблицы необходимо указать тип таблицы и определить один или несколько столбцов в качестве ключа сортировки. Таким образом, когда данные изначально загружаются в созданную таблицу, Selena может сортировать, обрабатывать и хранить данные на основе ключа сортировки. В этой теме описываются типы таблиц, которые предоставляет Selena для удовлетворения ваших различных бизнес-требований.

Основные понятия

Типы таблиц

Selena предоставляет четыре типа таблиц: таблица Duplicate Key, таблица Aggregate, таблица Unique Key и таблица Primary Key. Эти четыре типа таблиц хорошо подходят для широкого спектра сценариев анализа данных, таких как анализ логов, агрегация и анализ данных, а также анализ данных в реальном времени.

Ключи сортировки

Когда данные загружаются в таблицу, созданную с использованием определенного типа таблицы, данные сортируются и хранятся в соответствии с одним или несколькими столбцами, определенными как ключ сортировки при создании таблицы. Ключ сортировки обычно представляет собой один или несколько столбцов, которые часто используются в качестве условий фильтрации в запросах, тем самым ускоряя запросы.

Начиная с версии 1.5.0, таблицы Primary Key поддерживают определение ключей сортировки с помощью ORDER BY. Начиная с версии 1.5.0, таблицы Duplicate Key, таблицы Aggregate и таблицы Unique Key поддерживают определение ключей сортировки с помощью ORDER BY.

Для получения дополнительных описаний ключей сортировки см. Ключи сортировки и префиксные индексы.

Меры предосторожности

  • После создания таблицы вы не можете изменить ее тип. Например, вы не можете изменить таблицу Duplicate Key на таблицу Primary Key. Вы должны создать новую таблицу Primary Key.

  • Столбцы ключа сортировки должны быть определены перед другими столбцами в операторе создания таблицы.

  • Порядок столбцов ключа сортировки в операторе создания таблицы определяет порядок условий, на основе которых сортируются строки в таблице.

  • Длина префиксного индекса для таблицы ограничена 36 байтами. Если общая длина столбцов ключа сортировки превышает 36 байт, Selena сохраняет только первые несколько столбцов ключа сортировки в пределах ограничения длины для префиксного индекса.

  • Если записи, которые должны быть загружены в таблицу, имеют одинаковый первичный ключ, Selena обрабатывает и сохраняет записи в зависимости от типа таблицы:

    • Таблица Duplicate Key

      Selena загружает каждую из записей как отдельную строку в таблицу. После завершения загрузки данных таблица содержит строки с одинаковым первичным ключом, и строки отображают исходные записи в соотношении один к одному. Вы можете восстановить все исторические данные, которые вы загрузили.

    • Таблица Aggregate

      Selena агрегирует записи в одну запись и загружает агрегированную запись как строку в таблицу. После завершения загрузки таблица не содержит строк с одинаковым первичным ключом. Вы можете восстановить результаты агрегации всех исторических данных, которые вы загрузили. Однако вы не можете восстановить все исторические данные.

    • Таблица Unique Key и таблица Primary Key

      Selena заменяет каждую ранее загруженную запись вновь загруженной записью и сохраняет только самую последнюю загруженную запись как строку в таблице. После завершения загрузки таблица не содержит предыдущих строк с одинаковым первичным ключом. Сохраняется только последняя запись, содержащая тот же уникальный ключ/первичный ключ. Таблицу Unique Key и таблицу Primary Key можно рассматривать как специальную таблицу Aggregate, в которой для столбцов метрик указана агрегатная функция REPLACE для возврата самой последней записи среди группы записей с одинаковым первичным ключом.