CountText
Описание
Подсчитывает различные метрики во входящем тексте. Запрашиваемые результаты будут записаны как атрибуты. Содержимое результирующего FlowFile не будет изменено.
Теги
count, text, line, word, character
Свойства
Название | Описание |
---|---|
Count Lines | Если включено, будет подсчитываться количество строк во входящем тексте. |
Count Non-Empty Lines | Если включено, будет подсчитываться количество строк, содержащих символы, отличные от пробелов, в поступающем тексте. |
Count Words | Если включено, будет подсчитываться количество слов (групп буквенно-цифровых символов, разделённых пробелами) во входящем тексте. Обычные логические разделители [_-.] не разделяют слова, если не включена функция «Разделять слова по символам». |
Count Characters | Если включено, будет подсчитываться количество символов (включая пробелы и символы, но не включая новые строки и возврат каретки) во входящем тексте. |
Split Words on Symbols | Если этот параметр включен, то количество слов будет определяться как строки, разделенные общими логическими разделителями [ _ - . ] (например, split-words-on-symbols = 4 слова). |
Character Encoding | Указывает используемую кодировку символов. |
Call Immediate Adjustment | Если значение равно true, счетчик будет обновляться немедленно, независимо от того, будет ли сеанс ProcessSession зафиксирован или отменен; в противном случае счетчик будет увеличиваться только в том случае, если и когда сеанс ProcessSession будет зафиксирован. |
Взаимосвязи
- success: Файл потока содержит исходное содержимое с одним или несколькими добавленными атрибутами, содержащими соответствующие подсчёты
- failure: Если по какой-то причине текст файла потока не может быть подсчитан, исходный файл будет направлен в это место назначения, а в другие места ничего не будет направлено