constituent
Назначение
Находит документы, содержащие искомые аргументы в пределах указанного словосочетания (слова или группы слов, которые действуют как единое целое, например именной или глагольной группы).
Аргументы
Принимает несколько аргументов.
Первый опциональный параметр constituent_type позволяет определить тип словосочетания и принимает одно из следующих значений:
np - именная группа (a senior lawyer, the most often used accounts, the Harvard Graduate School)
vp - глагольная группа (contact your representative, will participate via conference call)
adjp - группа прилагательного (clinically significant, most innovative and secure)
advp - группа наречия (as easy as possible, even more)
pp - предложная группа (for your help, on Thursday, in the office)
qp - группа числительного (no less than six, over $1,000)
sbar - придаточное предложение (I’ll let you know [when we have some new information])
s - предложение (I hope you are doing well ; The meeting will probably take place on Thursday)
intj - междометие (yes, no, please)
prt - частица
lst - маркер списка (a., 1.)
prn - текст с вводными словами
frag - фрагмент (Step 1.)
nac - не словосочетание
rrc - сокращенное относительное придаточное предложение
whnp - группа существительного, начинающаяся на wh
whpp - предложная группа, начинающаяся на wh
x - неизвестно, не определено или неделимо
Если указан только тип словосочетания, а искомые слова не указаны, функция находит все словосочетания указанного типа.
Функция также поддерживает следующие опциональные именованные параметры:
-
min_length, max_length, length: длина (в токенах) задает минимальную/максимальную/точную длину словосочетания в токенах;
-
level:=min/max позволяет извлекать только словосочетания нижнего/верхнего уровня;
-
allow_punct:=yes/no разрешает или запрещает знаки пунктуации между аргументами (по умолчанию allow_punct:=yes);
-
allow_space:=yes/no разрешает или запрещает знаки пробела между аргументами (по умолчанию allow_space:=no);
-
match:=range позволяет полностью извлечь словосочетание, содержащее искомые слова.
-
whole:=yes позволяет извлечь словосочетания, состоящие только из аргументов поискового запроса.