char

Назначение

Ищет токены, принадлежащие к указанной категории.

Синтаксис

char(категория, аргумент_1, аргумент_2, …​ )

Аргументы

Первый параметр категория позволяет указать категорию токена и может принимать одно из нижеперечисленных значений:

Категория

Синоним

Описание

alpha

a

токены, состоящие только из алфавитных символов

alnum

an, alphanum

токены, состоящие из алфавитных и числовых символов

numeral

n, num

числа в любом написании (например, 125, 713.446.9307, 1-ый и т.д.)

digit

d

числа, состоящие только из цифр (без запятых, точек, слешей и т.д.)

special

sp

не алфавитные и не числовые символы (например, #, @, &, % и т.д.)

word

w

alpha|alnum|numeral|special

punct

p

любой пунктуационный знак

bracket

br

символ открывающей или закрывающей скобки

colon

col, ":"

символ двоеточия

comma

","

символ запятой

dot

"."

символ точки

exclamation

excl, "!"

символ восклицательного знака

hyphen

hp, "-"

символ тире/дефиса

lbracket

lb, "("

символ открывающей скобки

rbracket

rb, ")"

символ закрывающей скобки

question

qm, "?"

символ вопросительного знака

semicolon

sc, ";"

символ точки с запятой

slash

sl, "/"

символ слеш

quote

qt

символ любой кавычки

lquote

lqt

символ любой левой кавычки

rquote

rqt

символ любой правой кавычки

squote

sq, "'"

символ одинарной кавычки

lsquote

lsq, ‘

символ левой одинарной кавычки

rsquote

rsq, ’

символ правой одинарной кавычки

dquote

dq, "\""

символ двойной кавычки

ldquote

ldq, «

символ левой двойной кавычки

rdquote

rdq, »

символ правой двойной кавычки

plus

pl, "+"

символ плюс

plusminus

pm, ±

символ плюс-минус

equal

eq, "="

символ равно

less

ls, "<"

символ меньше

greater

gr, ">"

символ больше

tilde

td, ~

символ тильды

vline

vl, "|"

символ вертикальной черты

arabic

токены, состоящие из символов арабского алфавита

chinese

токены, состоящие из символов китайского алфавита

cyrillic

токены, состоящие из символов кириллического алфавита

greek

токены, состоящие из символов греческого алфавита

hiragana

токены, состоящие из символов алфавита хирагана

katakana

токены, состоящие из символов алфавита катакана

korean

токены, состоящие из символов корейского алфавита

latin

токены, состоящие из символов латинского алфавита

mixed

токены, состоящие из символов разных алфавитов

Примечание

  • Несколько пунктуационных знаков, заключенных в кавычки, рассматриваются как последовательность, т.е. char("?!") находит ?!.

  • Чтобы сузить поиск, можно перечислить параметры категории и алфавита через знак нижнего подчеркивания «_». Категория может быть только одна, а алфавитные параметры не ограничены.

Возвращаемое значение

Документы, соответствующие запросу.

Примеры

char(alnum) = char(an) находит A7, LAF006C, AH-26;

char(comma) = char(",") находит запятые;

char(digit) находит 100 и 11;

char(num) = char(n) находит 713.446.9307, 1,000, 100, 1-ый; 11;

phrase(0, char("\""), stem(noun), char("\"")) находит существительные в двойных кавычках;

char(alpha, term(mylist)) находит слова из класса слов «mylist», содержащие только алфавитные символы.

char(mixed) находит символы, состоящие из символов разных алфавитов («Cити-FM», «IT-продуктов»);

char(latin_greek) находит «interferon-β», «GSK-3β-dependent», «αB-crystallin», и т.д.

char(alnum_greek) matches «Δ6», «β2», и т.д.

char(alpha_cyrillic) найдет слова, состоящие только из букв кириллицы.

char(alnum_latin_cyrillic) найдет слова, содержащие одновременно цифры, а также символы латинского и кириллического алфавита, например, «wp7-устройство», «к750i».

char(alpha_cyrillic|numeral) найдет слова, состоящие только из букв кириллицы или любые числа.