Использование SRL в PDL-запросах

PolyAnalyst поддерживает два языка запросов, они предназначены для работы с различными типами колонок:

  1. PDL используется для работы с текстовыми колонками;

  2. SRL используется для работы с нетекстовыми колонками (например, String, Number или DateTime).

Выражения SRL и PDL могут быть объединены в один смешанный запрос с помощью операторов OR, AND, NOT, AND NOT, XOR. Смешанные запросы используются для применения нескольких условий поиска в нескольких колонках разных типов.

В смешанных запросах используются специальные правила форматирования.

PDL является языком запросов по умолчанию для узлов, предназначенных для работы с текстовыми колонками - например, «Поисковый запрос» или «Таксономия». Чтобы использовать смешанные запросы в таких узлах, нужно заключать запрос SRL в символы % (%выражение SRL%).

SRL является языком запросов по умолчанию для узлов, предназначенных для работы с нетекстовыми столбцами, например «Фильтрация строк» или «Производные колонки». Чтобы использовать смешанные запросы в таких узлах, нужно заключать PDL-запрос в одинарные кавычки и указывать колонку для поиска после символа @ ('выражение PDL@[Название колонки]').

Пример задачи: Анализ отзывов на автомобили

Рассмотрим задачу анализа отзывов на автомобили. Представим, что есть датасет, состоящий из трех столбцов: Текст, Производитель и Год выпуска.

pdl mixed 1 rus

Предположим, что пользователь хочет узнать информацию об автомобильных двигателях. Чтобы найти такую информацию, можно использовать простой PDL-запрос:

pdl mixed 2 rus

Однако для поиска информации о двигателях, относящейся к конкретному производителю автомобиля, необходимо использовать смешанный запрос:

pdl mixed 3 rus

Запрос ищет документы, у которых в столбце Производитель стоит значение «Производитель9», а в столбце «Текст» содержится фраза «двигатель». Запрос состоит из двух частей:

  1. "двигатель" - это PDL-запрос

  2. %[Производитель] = "Производитель9"% - это SRL-запрос

Так как узел «Поисковый запрос» работает с текстовыми колонками, там по умолчанию используется язык PDL, а SRL-запрос должен быть заключен в символы %.

Этот запрос можно расширить, например, можно найти отзывы на двигатели, относящиеся к моделям Производителя9 2000 года:

pdl mixed 4 rus

Следует отметить, что один и тот же запрос выглядит по-другому в узлах, использующих язык SRL по умолчанию, например, в узле «Фильтрация строк». В таком случае необходимо заключить часть запроса на языке PDL в символы ' и указать колонку поиска:

pdl mixed 5 rus