Перейти к основному содержимому

ExcelReader

Описание

Разбирает документ Microsoft Excel, возвращая каждую строку в каждом листе в виде отдельной записи. Этот считыватель позволяет вывести схему из всех необходимых листов или предоставить явную схему для интерпретации значений. См. раздел "Использование службы контроллера" для получения дополнительной информации. Этот считыватель в настоящее время способен обрабатывать только документы .xlsx (формат файлов XSSF 2007 OOXML) и не поддерживает старые документы .xls (формат файлов HSSF '97(-2007)).

Теги

excel, spreadsheet, xlsx, parse, record, row, reader, values, cell

Свойства

НазваниеОписание
Schema Access StrategyУказывает, как получить схему, которая будет использоваться для интерпретации данных.
Schema RegistryУказывает службу контроллера, которую следует использовать для реестра схемThis Property is only considered if the [Schema Access Strategy] Property is set to one of the following values: [Schema Reference Reader], [Use 'Schema Name' Property]
Schema NameУказывает имя схемы для поиска в свойстве реестра схем Поддерживает язык выражений: true (будет оцениваться с использованием атрибутов файла потока и переменных среды)This Property is only considered if the [Schema Access Strategy] Property has a value of "Use 'Schema Name' Property".
Schema VersionУказывает версию схемы для поиска в реестре схем. Если не указано, будет получена последняя версия схемы. Поддерживает язык выражений: true (будет оцениваться с использованием атрибутов файла потока и переменных среды)This Property is only considered if the [Schema Access Strategy] Property has a value of "Use 'Schema Name' Property".
Schema BranchУказывает имя ветки, которую нужно использовать при поиске схемы в реестре схем. Если выбранный реестр схем не поддерживает ветки, это значение будет проигнорировано. Поддерживает язык выражений: true (будет оцениваться с использованием атрибутов файла потока и переменных среды)This Property is only considered if the [Schema Access Strategy] Property has a value of "Use 'Schema Name' Property".
Schema TextТекст схемы в формате Avro Поддерживает язык выражений: true (будет оцениваться с использованием атрибутов файла потока и переменных среды)This Property is only considered if the [Schema Access Strategy] Property has a value of "Use 'Schema Text' Property".
Schema Reference ReaderРеализация сервиса, отвечающая за чтение атрибутов или содержимого FlowFile для определения идентификатора ссылки на схемуThis Property is only considered if the [Schema Access Strategy] Property has a value of "Schema Reference Reader".
Starting RowThe row number of the first row to start processing (One based). Use this to skip over rows of data at the top of a worksheet that are not part of the dataset. Поддерживает язык выражений: true (будет оцениваться с использованием атрибутов файла потока и переменных среды)
Required SheetsComma-separated list of Excel document sheet names whose rows should be extracted from the excel document. If this property is left blank then all the rows from all the sheets will be extracted from the Excel document. The list of names is case sensitive. Any sheets not specified in this value will be ignored. An exception will be thrown if a specified sheet(s) are not found. Поддерживает язык выражений: true (будет оцениваться с использованием атрибутов файла потока и переменных среды)
Protection TypeSpecifies whether an Excel spreadsheet is protected by a password or not.
PasswordThe password for a password protected Excel spreadsheet Чувствительный параметр: trueThis Property is only considered if the [Protection Type] Property has a value of "Password Protected".
Date FormatУказывает формат, который следует использовать при чтении/записи полей даты. Если не указано, поля даты будут считаться количеством миллисекунд с начала эпохи (полночь 1 января 1970 года по Гринвичу). Если указано, значение должно соответствовать простому формату даты Java (например, MM/dd/yyyy для двухзначного месяца, за которым следует двухзначный день, за которым следует четырёхзначный год, разделённые символами «/», как в 01/01/2017).
Time FormatУказывает формат, используемый при чтении/записи полей времени. Если не указано, то поля Time будут содержать количество миллисекунд с начала эпохи (полночь 1 января 1970 года по Гринвичу). Если указано, то значение должно соответствовать формату Simple Date в Java (например, HH:mm:ss для двухзначного часа в 24-часовом формате, за которым следует двухзначная минута, за которой следует двухзначная секунда, разделенные символами ':', как в 18:04:15).
Timestamp FormatУказывает формат, используемый при чтении/записи полей Timestamp. Если не указано, поля Timestamp будут считаться количеством миллисекунд с начала эпохи (полночь 1 января 1970 года по Гринвичу). Если указано, значение должно соответствовать формату Java Simple Date (например, MM/dd/yyyy HH:mm:ss для двухзначного месяца, за которым следует двухзначный день, за которым следует четырехзначный год, разделенные символами «/»; затем следует двухзначный час в 24-часовом формате, за которым следует двухзначная минута, за которой следует двухзначная секунда, разделенные символами «:», как в 01/01/2017 18:04:15).