Иерархическая организация правил
В предыдущем разделе были представлены простые правила для извлечения текстовых паттернов. Этот раздел посвящен организации правила в иерархическую структуру. Такой подход применяется, когда текстовый паттерн сложно извлечь одним правилом.
Рассмотрим правило на Изображении 1, которое извлекает названия министерств типа «министерство + существительное в родительном падеже»:
Это правило извлекает такие паттерны, как «Министерство спорта», «Министерство финансов», но в текстах встречаются и более длинные названия: «Министерство образования и науки», «министерство строительства и ЖКХ». Чтобы извлечь оба типа названий, можно добавить еще одно правило того же уровня:
Обратите внимание, что у двух правил есть общая часть «министерство + существительное в родительном падеже». Ее извлекают дважды: сначала по правилу «Ministry», а затем по правилу «Ministry_2». Для оптимизации можно заменить правило того же уровня дочерним. Все, что было извлечено родительским правилом, можно использовать в дочернем с помощью обратной ссылки. Как показано на Изображении 3, родительское правило извлекает общую часть - она сохраняется как именованная группа «min». В дочернем правиле ее можно вызвать, используя ссылку $min. В этом случае паттерн «министерство + существительное в родительном падеже» извлекается только один раз.
Правила можно расширить для извлечения таких паттернов, как «Министерство промышленности и торговли РФ», как показано на Изображении 4.
Примечание
XPDL часто предоставляет несколько способов получения одинаковых результатов. На Изображении 5 видно, что для получения того же результата можно использовать одно правило.
Читать и расширять такие сложные запросы непросто, поэтому рекомендуется разбить одно правило со сложным запросом на несколько простых вложенных правил. Такие правила легче читать, поддерживать и при необходимости перегруппировывать.
Таким образом, иерархическая структура облегчает чтение и редактирование правил. В иерархии правил может быть одно или несколько родительских и дочерних правил, а у каждого правила в такой структуре может быть одно или несколько дочерних или параллельных правил.
Например, правило на Изображении 4 можно расширить, добавив еще одно правило на уровне родительского. Как показано на Изображении 6, правило «Ministry_for» находится на одном уровне с правилом «Ministry» и ищет названия министерств типа «министерство + по + последовательность из двух или трех существительных или прилагательных» (например, «Министерство по развитию Дальнего Востока»).