todocpart
Аргументы
Функция принимает два обязательных аргумента. Первый аргумент название_раздела указывает имя раздела, который необходимо извлечь. Этот аргумент принимает значения, перечисленные в таблице ниже.
Значение |
Пояснение |
section |
текст всей секции (под секцией понимает область документа, ограниченную заголовками одного уровня) |
section_level |
уровень секции (совпадает с уровнем заголовка) |
heading |
заголовок секции |
headin_level |
уровень заголовка |
table |
текст всей таблицы, включая имя; |
table_name |
имя таблицы; |
row_text |
текст всей строки (значения всех ячеек, разделенные пробелом); |
row_name |
имя строки (значение крайней левой ячейки строки); |
col_text |
текст всего столбца (значения всех ячеек, разделенные пробелом); |
col_name |
имя столбца (значение верхней ячейки столбца столбца); |
cell_text |
значение ячейки; |
cell_unit |
единицы измерения ячейки (если задано). |
cell_factor |
масштабный коэффициент ячейки. |
table_num |
номер таблицы. |
row_num |
номер строки. |
col_num |
номер столбца. |
page |
Возвращает текст страницы, где был найден аргумент. |
page_num |
Возвращает номер страницы, где был найден аргумент. |
hyperlink |
интернет-ссылка |
Второй обязательный аргумент — ссылка на именованную группу. Функция также принимает следующие опциональные именованные параметры:
Параметр |
Пояснение |
first := <numeral> |
При отсутствии аргументов параметр трактуется как диапазон значений. При наличии аргументов параметр задает смещение начального аргумента. |
last := <numeral> |
При отсутствии аргументов параметр трактуется как диапазон значений. При наличии аргументов параметр задает смещение конечного аргумента. |
separator:=<string> |
Для разделения найденных аргументов можно указать пользовательский разделитель. По умолчанию разделитель равен ";". |
table_level := <numeral> |
Задает уровень таблиц. По умолчанию уровень не задан. |
nested := <string> |
Определяет диапазон поиска внутри/вне/внутри и вне вложенных таблиц. Возможные значения: «yes»/«no»/«any»; по умолчанию - «any». |
has_nested := <string> |
Уточняет, имеет ли таблица вложенные таблицы. Возможные значения: «yes»/«no»/«any»; по умолчанию - «any». |
parent_table := <string> |
Определяет, выводить ли результат для родительской таблицы (родительской считается таблица на один уровень выше). Возможные значения: «yes»/«no»/«any»; по умолчанию - «no». |
ocr_confidence |
Возвращает целое число, соответствующее минимальной достоверности распознавания слов, входящих в форматируемый аргумент, OCR-модулем. |
default:=<string> |
Позволяет присвоить аргументу значение по умолчанию. |
Примечания
-
Параметры first и last можно использовать автономно, без указания именованной группы.
-
Параметр section позволяет сократить область поиска благодаря параметру field, который может принимать значения body (тело текста), heading (заголовок) и any (тело текста и заголовок). По умолчанию field:=any.
-
Параметр hyperlink ищет гиперссылки только в html-страницах. Для его корректной работы необходимо выполнить узел «Интернет», а затем присоединить к нему тот узел, в котором будут использоваться полученные результаты.
-
Параметр hyperlink позволяет сократить область поиска благодаря параметру field, который может принимать значения text (имя гиперссылки) и url (URL гиперссылки). По умолчанию field:=text.
-
Именованные параметры поиска элементов таблицы совпадают с параметрами форматирующей функции totable(). Например, параметры first и last задают смещение начальной и конечной позиции относительно найденного результата. По умолчанию first:=0, last:=0.
-
У параметров first и last есть два алгоритма работы. В случае с table и table_name они действуют в рамках всего документа. То есть извлекается предыдущая/следующая таблица/имя таблицы по расположению в тексте. Для всех остальных параметров first и last действуют только в рамках одной таблицы.
-
При использовании параметров first и last в случае разрывного аргумента (или при отсутствии аргументов) повторяющиеся элементы, которые находит поисковый запрос, не удаляются. То есть сначала выводится диапазон от first до last для первого результата, затем для второго и т.д. Так сделано для удобства анализа результатов.