Создание дерева таксономии на основе словаря
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server. |
На текущий момент данная функция доступна в нативной версии Аналитического клиента. |
При анализе текста вы можете сгенерировать таксономию автоматически, используя шаблон PDL-выражения, который создает категорию для каждого элемента в списке. Данная опция работает только на основе семантического словаря.
Нажмите кнопку Создать дерево таксономии на основе словаря, чтобы открыть диалоговое окно Словарные отношения:
Для создания таксономии в поле Токен введите слово или фразу, после чего нажмите на кнопку с изображением стрелки справа или клавишу Enter.
В поле Значения вы увидите все возможные значения для введенного слова, которые зафиксированы в словаре WordNet. Так, например, на следующем скриншоте в области предварительного просмотра представлены значения слова steal вместе с примерами употребления:
Чекбоксы слева от значений используются для отключения лишних вариантов.
В выпадающем меню Колонка автоматически указываются доступные текстовые колонки, на основе которых строится таксономия. В нашем примере это колонка Description из тренировочного набора данных CrimeData.csv
.
Выпадающее меню Тип отношений позволяет выбрать интересующий вас тип семантических отношений (антонимия, гиперонимия, меронимия, холонимия, и др.) из тех, что зафиксированы в словаре.
Опция Включить выбранные значения позволяет включать в дерево таксономии выбранные значения наряду со словами, которые связаны с ними по выбранному отношению (например, гипонимы). Если данная опция включена, дерево таксономии, автоматически созданное на основе словаря, будет идентично дереву, созданному вручную с помощью соответствующего PDL-выражения.
И наоборот, если опция отключена, слова в выбранных значениях не попадут в результирующее дерево: в нем будут только слова, связанные указанным отношением с выбранным словом и его значениями.
Опция Максимальный уровень позволяет указать, сколько уровней в иерархии словаря узел должен использовать. Корень дерева – первый уровень, его потомки – второй, потомки потомков – третий и т.д. По умолчанию используется только один уровень.
Поле Части речи отображает возможные части речи для слова, указанного в поле Токен. С помощью чекбоксов можно отключить некоторые значения, которые не представляют особого интереса.
Поле Шаблон наименования узлов используется для определения способа наименования узлов таксономии. По умолчанию в названиях узлов отображается заданное слово и выбранный тип семантических отношений.
По завершении настройки нажмите ОК для того, чтобы создать таксономию и закрыть окно. Обновите дерево таксономии. На скриншоте ниже представлен пример таксономии, созданной на основе словаря: