Kafka connector for StarRocks
Загрузка данных с использованием Kafka connector
Selena предоставляет собственный коннектор под названием Apache Kafka® connector (Selena Connector for Apache Kafka®), который непрерывно потребляет сообщения из Kafka и загружает их в Selena. Kafka connector гарантирует семантику at-least-once.
Kafka connector может легко интегрироваться с Kafka Connect, что позволяет Selena лучше интегрироваться с экосистемой Kafka. Это мудрый выбор, если вы хотите загружать данные в реальном времени в Selena. По сравнению с Routine Load, рекомендуется использовать Kafka connector в следующих сценариях:
- По сравнению с Routine Load, который поддерживает загрузку данных только в форматах CSV, JSON и Avro, Kafka connector может загружать данные в большем количестве форматов, таких как Protobuf. Пока данные могут быть преобразованы в форматы JSON и CSV с использованием конвертеров Kafka Connect, данные могут быть загружены в Selena через Kafka connector.
- Настройка преобразования данных, например данные CDC в формате Debezium.
- Загрузка данных из нескольких топиков Kafka.
- Загрузка данных из Confluent Cloud.
- Необходимость более точного контроля над размерами пакетов загрузки, параллелизмом и другими параметрами для достижения баланса между скоростью загрузки и использованием ресурсов.
Подготовка
Требования к версиям
| Connector | Kafka | Selena | Java |
|---|---|---|---|
| 1.0.4 | 3.4 | 2.5 и позже | 8 |
| 1.0.3 | 3.4 | 2.5 и позже | 8 |
Настройка среды Kafka
Поддерживаются как самоуправляемые кластеры Apache Kafka, так и Confluent Cloud.
- Для самоуправляемого кластера Apache Kafka вы можете обратиться к Apache Kafka quickstart для быстрого развертывания кластера Kafka. Kafka Connect уже интегрирован в Kafka.
- Для Confluent Cloud убедитесь, что у вас есть учетная запись Confluent и вы создали кластер.
Загрузка Kafka connector
Отправьте Kafka connector в Kafka Connect:
-
Самоуправляемый кластер Kafka:
Загрузите и извлеките starrocks-kafka-connector-xxx.tar.gz.
-
Confluent Cloud:
В настоящее время Kafka connector не загружен в Confluent Hub. Вам нужно загрузить и извлечь starrocks-kafka-connector-xxx.tar.gz, упаковать его в ZIP-файл и загрузить ZIP-файл в Confluent Cloud.