Создание дерева таксономии на основе словаря
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server.
На текущий момент данная функция доступна в нативной версии Аналитического клиента.

При анализе текста вы можете сгенерировать таксономию автоматически, используя шаблон PDL-выражения, который создает категорию для каждого элемента в списке. Данная опция работает только на основе семантического словаря.

Нажмите кнопку Создать дерево таксономии на основе словаря, чтобы открыть диалоговое окно Словарные отношения:

tax from dict button.rus

Для создания таксономии в поле Токен введите слово или фразу, после чего нажмите на кнопку с изображением стрелки справа или клавишу Enter.

tax from dict.rus

В поле Значения вы увидите все возможные значения для введенного слова, которые зафиксированы в словаре WordNet. Так, например, на следующем скриншоте в области предварительного просмотра представлены значения слова steal вместе с примерами употребления:

tax from dict example.rus

Чекбоксы слева от значений используются для отключения лишних вариантов.

В выпадающем меню Колонка автоматически указываются доступные текстовые колонки, на основе которых строится таксономия. В нашем примере это колонка Description из тренировочного набора данных CrimeData.csv.

tax from dict column.rus

Выпадающее меню Тип отношений позволяет выбрать интересующий вас тип семантических отношений (антонимия, гиперонимия, меронимия, холонимия, и др.) из тех, что зафиксированы в словаре.

tax from dict relation.rus

Опция Включить выбранные значения позволяет включать в дерево таксономии выбранные значения наряду со словами, которые связаны с ними по выбранному отношению (например, гипонимы). Если данная опция включена, дерево таксономии, автоматически созданное на основе словаря, будет идентично дереву, созданному вручную с помощью соответствующего PDL-выражения.

Так, например, дерево таксономии для слова steal, созданное на основе словаря, будет идентично дереву, созданному с помощью PDL-выражения с функцией hyponym(): hyponym(lemma(verb, steal)).

И наоборот, если опция отключена, слова в выбранных значениях не попадут в результирующее дерево: в нем будут только слова, связанные указанным отношением с выбранным словом и его значениями.

Опция Максимальный уровень позволяет указать, сколько уровней в иерархии словаря узел должен использовать. Корень дерева – первый уровень, его потомки – второй, потомки потомков – третий и т.д. По умолчанию используется только один уровень.

Поле Части речи отображает возможные части речи для слова, указанного в поле Токен. С помощью чекбоксов можно отключить некоторые значения, которые не представляют особого интереса.

Поле Шаблон наименования узлов используется для определения способа наименования узлов таксономии. По умолчанию в названиях узлов отображается заданное слово и выбранный тип семантических отношений.

По завершении настройки нажмите ОК для того, чтобы создать таксономию и закрыть окно. Обновите дерево таксономии. На скриншоте ниже представлен пример таксономии, созданной на основе словаря:

tax from dict tree.rus