constituent

Назначение

Находит документы, содержащие искомые аргументы в пределах указанного словосочетания (слова или группы слов, которые действуют как единое целое, например именной или глагольной группы).

Синтаксис

constituent([constituent_type,] term1, term2…​ )

Аргументы

Принимает несколько аргументов.

Первый опциональный параметр constituent_type позволяет определить тип словосочетания и принимает одно из следующих значений:

np - именная группа (a senior lawyer, the most often used accounts, the Harvard Graduate School)

vp - глагольная группа (contact your representative, will participate via conference call)

adjp - группа прилагательного (clinically significant, most innovative and secure)

advp - группа наречия (as easy as possible, even more)

pp - предложная группа (for your help, on Thursday, in the office)

qp - группа числительного (no less than six, over $1,000)

sbar - придаточное предложение (I’ll let you know [when we have some new information])

s - предложение (I hope you are doing well ; The meeting will probably take place on Thursday)

intj - междометие (yes, no, please)

prt - частица

lst - маркер списка (a., 1.)

prn - текст с вводными словами

frag - фрагмент (Step 1.)

nac - не словосочетание

rrc - сокращенное относительное придаточное предложение

whnp - группа существительного, начинающаяся на wh

whpp - предложная группа, начинающаяся на wh

x - неизвестно, не определено или неделимо

Если указан только тип словосочетания, а искомые слова не указаны, функция находит все словосочетания указанного типа.

Функция также поддерживает следующие опциональные именованные параметры:

  • min_length, max_length, length: длина (в токенах) задает минимальную/максимальную/точную длину словосочетания в токенах;

  • level:=min/max позволяет извлекать только словосочетания нижнего/верхнего уровня;

  • allow_punct:=yes/no разрешает или запрещает знаки пунктуации между аргументами (по умолчанию allow_punct:=yes);

  • allow_space:=yes/no разрешает или запрещает знаки пробела между аргументами (по умолчанию allow_space:=no);

  • match:=range позволяет полностью извлечь словосочетание, содержащее искомые слова.

  • whole:=yes позволяет извлечь словосочетания, состоящие только из аргументов поискового запроса.

Возвращаемое значение

Документы, соответствующие запросу.

Примеры

constituent(approve, report) находит «Please approve the attached expense report», «The report has to be approved by the end of the week.», и т.д.;

constituent(np) находит все именные группы;

constituent(provide, value) находит «The report provides value" и "The report provides value in millions of US dollars».

constituent(provide, value, whole:=yes) находит «The report provides value».