Hive Bitmap UDF
Hive Bitmap UDF предоставляет UDF-функции, которые можно напрямую использовать в Hive. Они могут применяться для генерации данных Bitmap и выполнения связанных с Bitmap вычислений.
Формат Bitmap, определенный в Hive Bitmap UDF, согласован с форматом в Selena и может напрямую использоваться для загрузки данных Bitmap в Selena и выгрузки данных Bitmap из Selena в Hive.
Применимые сценарии:
- Объем исходных данных велик, и прямая загрузка этих данных в Selena для вычислений создаст огромную нагрузку на кластеры Selena. Желаемое решение — генерация данных Bitmap в Hive с последующей загрузкой Bitmap в Selena.
- Экспорт данных Bitmap, сгенерированных в Selena, в Hive для использования другими системами.
Поддерживаемые типы исходных и целевых данных:
- v1.5.2 и более поздние версии поддерживают загрузку и выгрузку данных следующих типов: String, Base64 и Binary.
- v1.5.2 поддерживают только загрузку и выгрузку данных String и Base64.
Hive Bitmap UDF-функции, которые можно сгенерировать
-
com.starrocks.hive.udf.UDAFBitmapAgg
Объединяет несколько строк не-null значений в столбце в одну строку значений Bitmap, что эквивалентно встроенной агрегатной функции Selena bitmap_agg.
-
com.starrocks.hive.udf.UDAFBitmapUnion
Вычисляет объединение набора bitmap-ов, что эквивалентно встроенной агрегатной функции Selena bitmap_union.
-
com.starrocks.hive.udf.UDFBase64ToBitmap
Преобразует строку в кодировке base64 в bitmap, что эквивалентно встроенной функции Selena base64_to_bitmap.
-
com.starrocks.hive.udf.UDFBitmapAnd
Вычисляет пересечение двух bitmap-ов, что эквивалентно встроенной функции Selena bitmap_and.
-
com.starrocks.hive.udf.UDFBitmapCount
Подсчитывает количество значений в bitmap, что эквивалентно встроенной функции Selena bitmap_count.
-
com.starrocks.hive.udf.UDFBitmapFromString
Преобразует строку, разделенную запятыми, в bitmap, что эквивалентно встроенной функции Selena bitmap_from_string.
-
com.starrocks.hive.udf.UDFBitmapOr
Вычисляет объединение двух bitmap-ов, что эквивалентно встроенной функции Selena bitmap_or.
-
com.starrocks.hive.udf.UDFBitmapToBase64
Преобразует Bitmap в строку Base64, что эквивалентно встроенной функции Selena bitmap_to_base64.
-
com.starrocks.hive.udf.UDFBitmapToString
Преобразует bitmap в строку, разделенную запятыми, что эквивалентно встроенной функции Selena bitmap_to_string.
-
com.starrocks.hive.udf.UDFBitmapXor
Вычисляет набор уникальных элементов в двух Bitmap-ах, что эквивалентно встроенной функции Selena bitmap_xor.