ScanContent
Описание
Сканирует содержимое FlowFiles на наличие терминов, найденных в предоставленном пользователем словаре. Если термин найден, его версия, закодированная в UTF-8, будет добавлена к FlowFile с использованием атрибута 'matching.term'
Теги
aho-corasick, scan, content, byte sequence, search, find, dictionary
Свойства
Название | Описание |
---|---|
Dictionary File | Имя файла словаря терминовThis property requires exactly one file to be provided.. |
Dictionary Encoding | Указывает, как закодирован словарь. Если «текст», то термины словаря разделяются символами новой с троки и кодируются в UTF-8; если «двоичный», то термины словаря обозначаются 4-байтовым целым числом, указывающим длину термина, за которым следует сам термин |
Взаимосвязи
- unmatched: Файлы потока, которые не соответствуют ни одному термину в словаре, направляются в эту связь
- matched: Файлы потока, которые соответствуют хотя бы одному термину в словаре, будут перенаправлены в эту связь