Перейти к основному содержимому

ListFTP

Описание

Выполняет список файлов, находящихся на FTP-сервере. Для каждого найденного на удаленном сервере файла создается новый FlowFile с именем файла, установленным в атрибут filename. Это затем можно использовать в сочетании с FetchFTP для извлечения этих файлов.

Теги

list, ftp, remote, ingest, source, input, files

Свойства

НазваниеОписание
Listing StrategySpecify how to determine new/updated entities. See each strategy descriptions for detail.
HostnameПолное имя хоста или IP-адрес удаленной системы Поддерживает язык выражений: true (будет оцениваться только с использованием переменных среды)
PortПорт, к которому необходимо подключиться на удаленном хосте для получения данных с него Поддерживает язык выражений: true (будет оцениваться только с использованием переменных среды)
Имя пользователяИмя пользователя Поддерживает язык выражений: true (будет оцениваться только с использованием переменных среды)
PasswordПароль учетной записи пользователя Чувствительный параметр: true Поддерживает язык выражений: true (будет оцениваться только с использованием переменных среды)
Remote PathПуть в удаленной системе, по которому можно извлекать или перемещать файлы Поддерживает язык выражений: true (будет оцениваться только с использованием переменных среды)
Record WriterSpecifies the Record Writer to use for creating the listing. If not specified, one FlowFile will be created for each entity that is listed. If the Record Writer is specified, all entities will be written to a single FlowFile instead of adding attributes to individual FlowFiles.
Distributed Cache ServiceNOTE: This property is used merely for migration from old NiFi version before state management was introduced at version 0.5.0. The stored value in the cache service will be migrated into the state when this processor is started at the first time. The specified Controller Service was used to maintain state about what had been pulled from the remote server so that if a new node begins pulling data, it won't duplicate all of the work that has been done. If not specified, the information was not shared across the cluster. This property did not need to be set for standalone instances of NiFi but was supposed to be configured if NiFi had been running within a cluster.
Search RecursivelyЕсли значение равно true, то файлы будут извлекаться из произвольно вложенных подкаталогов; в противном случае доступ к подкаталогам не будет осуществляться
Follow symlinkЕсли значение равно true, будут извлекаться даже символьные файлы, а также вложенные символьные подкаталоги; в противном случае не будут считываться символьные файлы и не будут проходить через подкаталоги с символьными ссылками
File Filter RegexПредоставляет регулярное выражение Java для фильтрации имён файлов. Если указан фильтр, будут загружены только файлы, имена которых соответствуют этому регулярному выражению.
Path Filter RegexWhen Search Recursively is true, then only subdirectories whose path matches the given Regular Expression will be scanned
Ignore Dotted FilesIf true, files whose names begin with a dot (".") will be ignored
Remote Poll Batch SizeЗначение указывает, сколько путей к файлам нужно найти в заданном каталоге удалённой системы при просмотре списка файлов. Обычно это значение не требуется изменять, но при опросе удаленной системы с огромным количеством файлов это значение может быть критичным. Слишком высокое значение может привести к снижению производительности, а слишком низкое - к замедлению потока.
Connection TimeoutВремя ожидания до истечения срока при создании соединения.
Data TimeoutПри передаче файла между локальной и удаленной системой это значение указывает, сколько времени должно пройти без передачи данных между системами.
Connection ModeРежим подключения FTP
Transfer ModeРежим передачи данных FTP
Proxy Configuration ServiceSpecifies the Proxy Configuration Controller Service to proxy network requests. If set, it supersedes proxy settings configured per component. Supported proxies: HTTP + AuthN, SOCKS + AuthN
Proxy TypeТип прокси-сервера, используемый для передачи файлов
Proxy HostПолное имя хоста или IP-адрес прокси-сервера Поддерживает язык выражений: true (будет оцениваться только с использованием переменных среды)
Proxy PortПорт прокси-сервера Поддерживает язык выражений: true (будет оцениваться только с использованием переменных среды)
Имя пользователя HTTP-проксиИмя пользователя HTTP-прокси Поддерживает язык выражений: true (будет оцениваться только с использованием переменных среды)
Пароль HTTP-проксиПароль HTTP-прокси Чувствительный параметр: true Поддерживает язык выражений: true (будет оцениваться только с использованием переменных среды)
Internal Buffer SizeЗадайте размер внутреннего буфера для буферизованных потоков данных
Target System Timestamp PrecisionSpecify timestamp precision at the target system. Since this processor uses timestamp of entities to decide which should be listed, it is crucial to use the right timestamp precision.
Entity Tracking State CacheListed entities are stored in the specified cache storage so that this processor can resume listing across NiFi restart or in case of primary node change. 'Tracking Entities' strategy require tracking information of all listed entities within the last 'Tracking Time Window'. To support large number of entities, the strategy uses DistributedMapCache instead of managed state. Cache key format is 'ListedEntities::{processorId}(::{nodeId})'. If it tracks per node listed entities, then the optional '::{nodeId}' part is added to manage state separately. E.g. cluster wide cache key = 'ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b', per node cache key = 'ListedEntities::8dda2321-0164-1000-50fa-3042fe7d6a7b::nifi-node3' The stored cache content is Gzipped JSON string. The cache key will be deleted when target listing configuration is changed. Used by 'Tracking Entities' strategy.
Entity Tracking Time WindowSpecify how long this processor should track already-listed entities. 'Tracking Entities' strategy can pick any entity whose timestamp is inside the specified time window. For example, if set to '30 minutes', any entity having timestamp in recent 30 minutes will be the listing target when this processor runs. A listed entity is considered 'new/updated' and a FlowFile is emitted if one of following condition meets: 1. does not exist in the already-listed entities, 2. has newer timestamp than the cached entity, 3. has different size than the cached entity. If a cached entity's timestamp becomes older than specified time window, that entity will be removed from the cached already-listed entities. Used by 'Tracking Entities' strategy. Поддерживает язык выражений: true (будет оцениваться только с использованием переменных среды)
Entity Tracking Initial Listing TargetSpecify how initial listing should be handled. Used by 'Tracking Entities' strategy.
Use UTF-8 EncodingУказывает клиенту использовать кодировку UTF-8 при обработке файлов и имен файлов. Если установлено значение true, сервер также должен поддерживать кодировку UTF-8.

Взаимосвязи

  • success: все полученные файлы Flow направляются на этап успеха