chunk

Назначение

Находит документы, содержащие аргументы внутри одного словосочетания (простейшей синтаксической единицы, например, глагольной или именной группы).

Синтаксис

chunk()

chunk([тип_словосочетания,] аргумент_1, аргумент_2, …​)

chunk(тип_словосочетания)

Аргументы

У функции chunk() нет обязательных аргументов — при их отсутствии функция найдет все словосочетания. Первый опциональный параметр тип_словосочетания позволяет указать тип словосочетания:

np/pnou - именная группа (коммерческая организация, Московский государственный университет…​)

vp/pver - глагольная группа (не должен стать, может быть разработан…​)

jp/padj - группа прилагательного (очень уверенный, наиболее важный…​)

rp/padv - группа наречия (чаще всего..)

Если указан только тип словосочетания, а искомые аргументы не указаны, функция находит все словосочетания указанного типа.

Функция также поддерживает следующие опциональные именованные параметры:

  • allow_punct:=yes/no: допускает или запрещает наличие пунктуации между аргументами (значение по умолчанию - "yes");

  • allow_space:=yes/no допускает или запрещает наличие пробела между аргументами (значение по умолчанию - "yes");

  • match:=range извлекает фрагмент текста от первого до последнего найденного аргумента;

  • level:=top извлекает более крупные словосочетания, объединяющие несколько групп. Тип объединенного словосочетания определяется его вершиной.

  • whole:=yes извлекает словосочетания, состоящие только из аргументов поискового запроса.

Примечание

Действующие теги фрагмента можно проверить, используя узел Разметка текста.

Возвращаемое значение

Документы, соответствующие запросу.

Примеры

chunk() найдет все словосочетания.

chunk(строительный, компания) = chunk(компания, строительный) найдет словосочетание «строительная компания» в предложении «В конкурсе участвовали 3 строительные компании» и ничего не найдет в «Строительные работы выполняла известная компания»;

chunk(np, интерес, match:=range) найдет все именные группы, куда входит слово «интерес», например: «повышенный интерес», «всплеск интереса», «неподдельный личный интерес», «интерес национальной безопасности»;

chunk(np) найдет все именные группы, например, «три места», «День города», «Тверская улица», «ресторан "Южане"»;

chunk() найдет пять словосочетаний в предложении «Особое место занимает проблема развития творческих индустрий в России»: «Особое место», «занимает», «проблема развития творческих индустрий», «в», «России».

chunk(level:=top) найдет три словосочетания в предложении «Особое место занимает проблема развития творческих индустрий в России»: «Особое место», «занимает», «проблема развития творческих индустрий в России».

chunk(индексация, выплата) найдет «индексация социальных выплат» и «индексация выплат».

chunk(индексация, выплата, whole:=yes) найдет «индексация выплат».