docpart
Назначение
Находит документы, содержащие аргументы в определенных секциях документа (заголовках, таблицах, списках, оглавлении).
Аргументы
Первый обязательный аргумент раздел позволяет указать требуемую секцию документа и принимает одно из нижеперечисленных значений:
Функция принимает следующие неименованные параметры:
-
ocr находит документы, содержащие слова с высокой достоверностью распознавания OCR-модулем PolyAnalist.
-
confidence задает порог достоверности распознавания.
-
-
rotated/unrotated поиск повернутого/неповернутого текста (по умолчанию unrotated).
-
degree указывает градус поворота (например, 15, 16, 30.5, 45, 90, и т.д.)
-
type (horizontal/vertical) указывает тип поворота — вертикальный или горизонтальный.
-
scope (token/sentence/paragraph/text) задает выдачу результата по токенам, предложениям, параграфам или по всему тексту (по умолчанию scope:=text). Параметр работает, если нет вложенных аргументов.
-
Примечание
-
Для поиска по нескольким разделам следует перечислить их через «|».
-
Если указана только секция документа, функция находит все секции указанного типа.
-
Для ограничения поиска внутри числовых параметров можно использовать операторы сравнения «>», «<», «>=», «<=», «!=», например, docpart(table, col:>1, col:<3, row:>1).
-
Параметр page поддерживает форматы docx и pdf.
-
Функция docpart ищет пересечение запроса с разделами таблицы или со страницами, заданными аргументом number соответственно. Таким образом, запрос может лишь частично находиться в указанных разделах таблицы или на указанных страницах.
-
Атрибут number параметра page может принимать отрицательное значение. В таком случае он отсчитывается от последней страницы в документе, т.е. number:"-1" ограничивает запрос последней страницей, number:>="-2" ограничивает запрос последними двумя страницами.
-
Параметр hyperlink ищет гиперссылки только в html-страницах. Для его корректной работы необходимо выполнить узел «Интернет», а затем присоединить к нему тот узел, в котором будут использоваться полученные результаты.
-
Поиск повернутого текста возможен в документах формата .docx и в документах, распознанных OCR. Поворот документа рассматривается в двух направлениях: по часовой стрелке (положительное значение) и против часовой стрелки (отрицательное значение). Значение поворота задается в диапазоне [-180; 180] градусов.