Регулярные выражения

Регулярные выражения (сокращенно - RE или RegExp) - это мощный инструмент поиска по текстовым данным. В то время, как PDL позволяет выполнять поиск слов, регулярные выражения, в основном, используются для нахождения уникальных шаблонов (или последовательностей символов), которые не всегда являются словами:

Регулярное выражение [d]+og[s]* находит цепочки dog, dogs, а также ddog и ddddogs.

Регулярные выражения используются во многих инструментах текстовой обработки в PolyAnalyst. Например, узел Замена терминов может использовать регулярные выражения для изменения текста, скажем, с целью замены каждой последовательности символов [d]+og[s]* в тексте символами cat. Для выполнения поиска с использованием регулярных выражений в PDL используется функция regex.

Регулярные выражения применяются не только в PolyAnalyst. Во многих современных языках программирования имеется библиотека регулярных выражений. Многие известные инструменты текстовой обработки (например, Microsoft Word) позволяют выполнять поиск по документам с помощью регулярных выражений.

Помните, что существует несколько вариантов синтаксиса регулярных выражений. Синтаксис регулярных выражений в PolyAnalyst больше похож на синтаксис Perl 5 (этот язык программирования широко использовался для построения веб-форм). Вы не можете просто скопировать и вставить любое регулярное выражение, которое вы найдете в сети Интернет, и ожидать от него адекватной работы в системе PolyAnalyst. Однако если вы нашли регулярное выражение, которое написано на языке Perl, то вероятность успеха увеличивается. Однако мы все-таки рекомендуем нашим пользователям создавать собственные регулярные выражения. Если вы только начинаете изучать регулярные выражения, обратите внимание на то, что на разных сайтах могут описываться разные типы синтаксиса регулярных выражений. Единственный онлайн-ресурс, который мы рекомендуем нашим пользователям, - perldoc.perl.org.