Skip to main content

ScanContent

Описание

Сканирует содержимое FlowFiles на наличие терминов, найденных в предоставленном пользователем словаре. Если термин найден, его версия, закодированная в UTF-8, будет добавлена к FlowFile с использованием атрибута 'matching.term'

Теги

aho-corasick, scan, content, byte sequence, search, find, dictionary

Свойства

НазваниеОписание
Dictionary FileИмя файла словаря терминовThis property requires exactly one file to be provided..
Dictionary EncodingУказывает, как закодирован словарь. Если «текст», то термины словаря разделяются символами новой строки и кодируются в UTF-8; если «двоичный», то термины словаря обозначаются 4-байтовым целым числом, указывающим длину термина, за которым следует сам термин

Взаимосвязи

  • unmatched: Файлы потока, которые не соответствуют ни одному термину в словаре, направляются в эту связь
  • matched: Файлы потока, которые соответствуют хотя бы одному термину в словаре, будут перенаправлены в эту связь