Перейти к основному содержимому
Версия: 2.0.x

loads

loads предоставляет результаты задач загрузки. Это представление поддерживается начиная с Selena v1.5.2.

В loads предоставляются следующие поля:

ПолеОписание
IDГлобально уникальный идентификатор.
LABELМетка задачи загрузки.
PROFILE_IDID профиля, который можно проанализировать через ANALYZE PROFILE.
DB_NAMEБаза данных, к которой принадлежит целевая таблица.
TABLE_NAMEЦелевая таблица.
USERПользователь, который инициирует задачу загрузки.
WAREHOUSEWarehouse, к которому принадлежит задача загрузки.
STATEСостояние задачи загрузки. Допустимые значения:
  • PENDING/BEGIN: Задача загрузки создана.
  • QUEUEING/BEFORE_LOAD: Задача загрузки находится в очереди, ожидая планирования.
  • LOADING: Задача загрузки выполняется.
  • PREPARING: Транзакция находится в процессе предварительной фиксации.
  • PREPARED: Транзакция предварительно зафиксирована.
  • COMMITED: Транзакция зафиксирована.
  • FINISHED: Задача загрузки завершена успешно.
  • CANCELLED: Задача загрузки завершилась с ошибкой.
PROGRESSПрогресс стадий ETL и LOADING задачи загрузки.
TYPEТип задачи загрузки. Для Broker Load возвращаемое значение - BROKER. Для INSERT возвращаемое значение - INSERT. Для Stream Load возвращаемое значение - STREAM. Для Routine Load возвращаемое значение - ROUTINE.
PRIORITYПриоритет задачи загрузки. Допустимые значения: HIGHEST, HIGH, NORMAL, LOW и LOWEST.
SCAN_ROWSКоличество сканированных строк данных.
SCAN_BYTESКоличество сканированных байтов.
FILTERED_ROWSКоличество строк данных, отфильтрованных из-за недостаточного качества данных.
UNSELECTED_ROWSКоличество строк данных, отфильтрованных из-за условий, указанных в предложении WHERE.
SINK_ROWSКоличество загруженных строк данных.
RUNTIME_DETAILSМетаданные выполнения загрузки. Подробности см. в RUNTIME_DETAILS.
CREATE_TIMEВремя создания задачи загрузки. Формат: yyyy-MM-dd HH:mm:ss. Пример: 2023-07-24 14:58:58.
LOAD_START_TIMEВремя начала стадии LOADING задачи загрузки. Формат: yyyy-MM-dd HH:mm:ss. Пример: 2023-07-24 14:58:58.
LOAD_COMMIT_TIMEВремя фиксации транзакции загрузки. Формат: yyyy-MM-dd HH:mm:ss. Пример: 2023-07-24 14:58:58.
LOAD_FINISH_TIMEВремя завершения стадии LOADING задачи загрузки. Формат: yyyy-MM-dd HH:mm:ss. Пример: 2023-07-24 14:58:58.
PROPERTIESСтатические свойства задачи загрузки. Подробности см. в PROPERTIES.
ERROR_MSGСообщение об ошибке задачи загрузки. Если задача загрузки не столкнулась с ошибкой, возвращается NULL.
TRACKING_SQLSQL-запрос, который можно использовать для запроса журнала отслеживания задачи загрузки. SQL-запрос возвращается только тогда, когда задача загрузки включает некачественные строки данных. Если задача загрузки не включает некачественные строки данных, возвращается NULL.
REJECTED_RECORD_PATHПуть, по которому вы можете получить доступ ко всем некачественным строкам данных, отфильтрованным в задаче загрузки. Количество зарегистрированных некачественных строк данных определяется параметром log_rejected_record_num, настроенным в задаче загрузки. Вы можете использовать команду wget для доступа к пути. Если задача загрузки не включает некачественные строки данных, возвращается NULL.

RUNTIME_DETAILS

  • Универсальные метрики:
МетрикаОписание
load_idГлобально уникальный ID плана выполнения загрузки.
txn_idID транзакции загрузки.
  • Специфические метрики для Broker Load, INSERT INTO и Spark Load:
МетрикаОписание
etl_infoДетали ETL. Это поле действительно только для задач Spark Load. Для других типов задач загрузки значение будет пустым.
etl_start_timeВремя начала стадии ETL задачи загрузки. Формат: yyyy-MM-dd HH:mm:ss. Пример: 2023-07-24 14:58:58.
etl_start_timeВремя завершения стадии ETL задачи загрузки. Формат: yyyy-MM-dd HH:mm:ss. Пример: 2023-07-24 14:58:58.
unfinished_backendsСписок BE с незавершенными выполнениями.
backendsСписок BE, участвующих в выполнении.
file_numКоличество прочитанных файлов.
file_sizeОбщий размер прочитанных файлов.
task_numКоличество подзадач.
  • Специфические метрики для Routine Load:
МетрикаОписание
schedule_intervalИнтервал планирования Routine Load.
wait_slot_timeВремя, прошедшее пока задача Routine Load ожидает слотов выполнения.
check_offset_timeВремя, затраченное на проверку информации offset во время планирования задачи Routine Load.
consume_timeВремя, затраченное задачей Routine Load на чтение исходных данных.
plan_timeВремя генерации плана выполнения.
commit_publish_timeВремя, затраченное на выполнение COMMIT RPC.
  • Специфические метрики для Stream Load:
МетрикаОписание
timeoutТаймаут для задач загрузки.
begin_txn_msВремя, затраченное на начало транзакции.
plan_time_msВремя генерации плана выполнения.
receive_data_time_msВремя получения данных.
commit_publish_time_msВремя, затраченное на выполнение COMMIT RPC.
client_ipIP-адрес клиента.

PROPERTIES

  • Специфические свойства для Broker Load, INSERT INTO и Spark Load:
СвойствоОписание
timeoutТаймаут для задач загрузки.
max_filter_ratioМаксимальное соотношение строк данных, отфильтрованных из-за недостаточного качества данных.
  • Специфические свойства для Routine Load:
СвойствоОписание
job_nameИмя задачи Routine Load.
task_numКоличество подзадач, фактически выполняемых параллельно.
timeoutТаймаут для задач загрузки.