Skip to main content

SplitAvro

Описание

Разделяет двоично закодированный Avro-файл на более мелкие файлы на основе настроенного размера выходного файла. Стратегия вывода определяет, будут ли меньшие файлы Avro-файлами данных или простыми записями Avro с метаданными в атрибутах FlowFile. Вывод всегда будет двоично закодированным.

Теги

avro, split

Свойства

НазваниеОписание
Split StrategyСтратегия разделения входящего файла данных. Стратегия записи будет считывать входящий файл данных, десериализуя каждую запись.
Output SizeКоличество записей Avro, которые будут включены в каждый файл разделения. В случаях, когда во входящем файле меньше записей, чем указано в параметре OUTPUT_SIZE, или когда общее количество записей не делится нацело на OUTPUT_SIZE, можно получить файл разделения с меньшим количеством записей.
Output StrategyОпределяет формат вывода. Либо файл данных Avro, либо простая запись. Вывод простой записи предназначен только для использования в системах, которые уже требуют этого, и не должен быть необходим для обычного использования.
Transfer MetadataСледует ли передавать метаданные из родительского файла данных в дочерние. Если стратегией вывода является простая запись, то метаданные будут сохранены в виде атрибутов потокового файла, в противном случае они будут находиться в заголовке файла данных.

Взаимосвязи

  • failure: Если обработка FlowFile завершится неудачно по какой-либо причине (например, FlowFile не является допустимым Avro), он будет направлен по этому каналу связи
  • original: Исходный файл Flow, который был разделён. Если обработка FlowFile завершится неудачно, ничего не будет отправлено по этому каналу связи
  • split: Все новые файлы, разделённые из исходного FlowFile, будут направлены по этому каналу связи