Перейти к основному содержимому

CountText

Описание

Подсчитывает различные метрики во входящем тексте. Запрашиваемые результаты будут записаны как атрибуты. Содержимое результирующего FlowFile не будет изменено.

Теги

count, text, line, word, character

Свойства

НазваниеОписание
Count LinesЕсли включено, будет подсчитываться количество строк во входящем тексте.
Count Non-Empty LinesЕсли включено, будет подсчитываться количество строк, содержащих символы, отличные от пробелов, в поступающем тексте.
Count WordsЕсли включено, будет подсчитываться количество слов (групп буквенно-цифровых символов, разделённых пробелами) во входящем тексте. Обычные логические разделители [_-.] не разделяют слова, если не включена функция «Разделять слова по символам».
Count CharactersЕсли включено, будет подсчитываться количество символов (включая пробелы и символы, но не включая новые строки и возврат каретки) во входящем тексте.
Split Words on SymbolsЕсли этот параметр включен, то количество слов будет определяться как строки, разделенные общими логическими разделителями [ _ - . ] (например, split-words-on-symbols = 4 слова).
Character EncodingУказывает используемую кодировку символов.
Call Immediate AdjustmentЕсли значение равно true, счетчик будет обновляться немедленно, независимо от того, будет ли сеанс ProcessSession зафиксирован или отменен; в противном случае счетчик будет увеличиваться только в том случае, если и когда сеанс ProcessSession будет зафиксирован.

Взаимосвязи

  • success: Файл потока содержит исходное содержимое с одним или несколькими добавленными атрибутами, содержащими соответствующие подсчёты
  • failure: Если по какой-то причине текст файла потока не может быть подсчитан, исходный файл будет направлен в это место назначения, а в другие места ничего не будет направлено