Использование SRL в PDL-запросах
PolyAnalyst поддерживает два языка запросов, они предназначены для работы с различными типами колонок:
-
PDL используется для работы с текстовыми колонками;
-
SRL используется для работы с нетекстовыми колонками (например, String, Number или DateTime).
Выражения SRL и PDL могут быть объединены в один смешанный запрос с помощью операторов OR, AND, NOT, AND NOT, XOR. Смешанные запросы используются для применения нескольких условий поиска в нескольких колонках разных типов.
В смешанных запросах используются специальные правила форматирования.
PDL является языком запросов по умолчанию для узлов, предназначенных для работы с текстовыми колонками - например, «Поисковый запрос» или «Таксономия». Чтобы использовать смешанные запросы в таких узлах, нужно заключать запрос SRL в символы % (%выражение SRL%).
SRL является языком запросов по умолчанию для узлов, предназначенных для работы с нетекстовыми столбцами, например «Фильтрация строк» или «Производные колонки». Чтобы использовать смешанные запросы в таких узлах, нужно заключать PDL-запрос в одинарные кавычки и указывать колонку для поиска после символа @ ('выражение PDL@[Название колонки]').
Пример задачи: Анализ отзывов на автомобили
Рассмотрим задачу анализа отзывов на автомобили. Представим, что есть датасет, состоящий из трех столбцов: Текст, Производитель и Год выпуска.
Предположим, что пользователь хочет узнать информацию об автомобильных двигателях. Чтобы найти такую информацию, можно использовать простой PDL-запрос:
Однако для поиска информации о двигателях, относящейся к конкретному производителю автомобиля, необходимо использовать смешанный запрос:
Запрос ищет документы, у которых в столбце Производитель стоит значение «Производитель9», а в столбце «Текст» содержится фраза «двигатель». Запрос состоит из двух частей:
-
"двигатель" - это PDL-запрос
-
%[Производитель] = "Производитель9"% - это SRL-запрос
Так как узел «Поисковый запрос» работает с текстовыми колонками, там по умолчанию используется язык PDL, а SRL-запрос должен быть заключен в символы %.
Этот запрос можно расширить, например, можно найти отзывы на двигатели, относящиеся к моделям Производителя9 2000 года:
Следует отметить, что один и тот же запрос выглядит по-другому в узлах, использующих язык SRL по умолчанию, например, в узле «Фильтрация строк». В таком случае необходимо заключить часть запроса на языке PDL в символы ' и указать колонку поиска: