Поиск с учетом длины аргумента
Для поиска синтаксических и текстовых единиц определенной длины (слов, словосочетаний, предложений) используется функция length().
Синтаксис
Минимальная длина (минимальное количество символов) указывается в качестве первого обязательного параметра функции. Максимальная длина при необходимости указывается в качестве второго необязательного параметра.
Пример
Чтобы указать единицу, в которой будет измеряться длина слова или предложения, можно использовать опциональный именованный параметр count:=, который может принимать следующие значения:
Значение |
Пояснение |
character |
длина в символах (значение по умолчанию) |
token |
длина в токенах (токен — это последовательность символов между разделителями) |
word |
длина в словах |
punctuation |
задает количество знаков пунктуации |
Запросить фразу с указанным количеством токенов можно, например, на результатах работы узлов «Извлечение ключевых слов» (keyword()), «Извлечение сущностей» (entity()) и т.д.
Пример
Подробнее о функциях entity() и keyword(), использованных в примерах, см. «Поиск объектов, извлеченных другими узлами текстового анализа».