Загрузка данных
🗃️ Обзор загрузки
4 элемента
🗃️ Загрузка из объектного хранилища
8 элементов
📄️ Загрузка данных из локальной файловой системы
Selena предоставляет два метода загрузки данных из локальной файловой системы:
📄️ Загрузка данных из HDFS
Selena предоставляет следующие варианты для загрузки данных из HDFS:
🗃️ Загрузка данных из Apache Kafka
2 элемента
🗃️ Загрузка данных из Apache Spark
2 элемента
📄️ Загрузка данных с помощью INSERT
Эта тема описывает, как загружать данные в Selena с помощью SQL-оператора - INSERT.
📄️ Загрузка данных с использованием транзакционного интерфейса Stream Load
Начиная с версии 1.5.0, Selena предоставляет транзакционный интерфейс Stream Load для реализации двухфазного коммита (2PC) для транзакций, которые выполняются для загрузки данных из внешних систем, таких как Apache Flink® и Apache Kafka®. Транзакционный интерфейс Stream Load помогает улучшить производительность высококонкурентных потоковых загрузок.
📄️ Синхронизация в реальном времени из MySQL
Selena поддерживает несколько методов синхронизации данных из MySQL в Selena в реальном времени, обеспечивая аналитику массивных данных в реальном времени с низкой задержкой.
📄️ Непрерывная загрузка данных из Apache Flink®
Selena предоставляет собственный коннектор под названием Selena Connector for Apache Flink® (сокращенно Flink коннектор), который помогает загружать данные в таблицу Selena с помощью Flink. Основной принцип заключается в накоплении данных и последующей их загрузке за один раз в Selena через STREAM LOAD.
📄️ Изменение данных через загрузку
Таблицы с первичным ключом, предоставляемые Selena, позволяют вносить изменения в данные таблиц Selena путем выполнения заданий Stream Load, Broker Load или Routine Load. Эти изменения данных включают вставки, обновления и удаления. Однако таблицы с первичным ключом не поддерживают изменение данных с использованием Spark Load или INSERT.
📄️ Преобразование данных при загрузке
Selena поддерживает преобразование данных при загрузке.
📄️ Загрузка данных с помощью инструментов
Selena и её партнеры по экосистеме предлагают следующие инструменты, которые помогут вам легко интегрировать Selena с внешними базами данных.
📄️ Строгий режим
Строгий режим — это дополнительное свойство, которое можно настроить для загрузки данных. Оно влияет на поведение загрузки и итоговые загруженные данные.