word
Назначение
Функция позволяет искать токены по таким критериям, как капитализация, морфологическая категория, тип токена, алфавит. Она дублирует функционал функций char(), lemma(), stem(), form(), case(), позволяя записывать запросы более кратко.
Аргументы
Функция принимает один аргумент. В отсутствие аргумента функция находит любой тип токена.
Первый аргумент используется для описания части речи, модификатора, капитализации, алфавита, и т.п.
Функция также поддерживает следующие именованные параметры:
Параметр |
Пояснение |
sentpart |
Задает поиск с учетом синтаксической функции. |
length |
Задает поиск с учетом длины токена. |
ocr |
Задает поиск слов с высокой достоверностью распознавания OCR-модулем PolyAnalyst. |
modality |
Задает поиск с учетом модальности. |
negate:=yes/no/any |
Задает/отключает поиск отрицательных конструкций. |
regex:=yes/no |
Задает/отключает поиск регулярных выражений. |
junk |
Задает поиск слов, содержащих неалфавитные символы или слишком большое количество согласных. |
nojunk |
Исключает из поиска слова, содержащие неалфавитные символы или слишком большое количество согласных. |
case |
Задает поиск с учетом капитализации. |
alphabet |
Задает поиск с учетом алфавитной записи. |
Можно указать несколько именованных параметров, используя символы «_» (И) и «|» (ИЛИ), например, word(noun_upper|adjective) или word(noun_upper_adjective).
Аргументы можно указывать в том числе при помощи именованных параметров lemma/stem/form, например, word(lemma:=начинать)
При возникновении конфликта между первым аргументом и именованным параметром, приоритет за именованным параметром.