textpart

Назначение

Функция textpart извлекает части текста в соответствии с указанными номерами предложений и/или позиций. Позиции указываются с помощью именованных параметров.

Синтаксис

textpart(строка,…​)

Аргументы

Функция принимает строковые или текстовые данные или колонки, из которых извлекаеется часть текста. Именованный параметр определяет тип позиции. Используются следующие именованные параметры:

  • start_sentence - определяет номер предложения, начиная с которого извлекается часть текста;

  • end_sentence - определяет номер предложения, до которого извлекается часть текста;

  • start_token - определяет номер токена, начиная с которого извлекается часть текста;

  • end_token - определяет номер токена, до которого извлекается часть текста;

  • start_symbol - определяет номер символа, начиная с которого извлекается часть текста;

  • length_symbol - определяет число символов в извлекаемой части текста;

  • length_token - определяет длину токена в извлекаемой части текста.

С именованными параметрами можно использовать названия колонок:

textpart([Text], start_sentence:=[StartSentence]) возвращает предложения начиная с колонки StartSentence

Возвращаемое значение

Функция возвращает часть текста в соответствии с указанными параметрами.

Если указан только номер предложения, функция возвращает текст этого предложения. Если дополнительно указывается токен, функция также возвращает текст этого токена. В случае, если номер предложения не указан, но указан номер токена, то данный токен берется от начала текста.

Примеры

textpart([Text], start_sentence:=1, end_sentence:=3) - возвращает первые три предложения из колонки Text

textpart([Text], start_token:=1, end_token:=5) - возвращает первые пять токенов из колонки Text