Информация по производительности и масштабируемости таксономии
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server. |
Создание таксономии включает в себя следующие шаги:
-
В ходе выполнения узла PolyAnalyst сначала проверяет, проиндексированы ли колонки, которые были выбраны в качестве колонок по умолчанию. Если индексация не была проведена, PolyAnalyst выполняет данную операцию в первую очередь. Подробнее об индексации см. здесь.
-
В процессе создания таксономии PolyAnalyst оценивает каждое заданное выражение категории и определяет, какие записи соответствуют той или иной категории. Также вычисляется релевантность записей и категорий.
-
Выполнение узла завершается тогда, когда все записи исходной таблицы распределяются по соответствующим категориям. Степень выполнения задачи измеряется исходя из отношения числа категоризованных записей к общему количеству записей в таблице.
Производительность таксономии – это комплексный показатель, который зависит от количества категорий, глубины таксономии (иерархической структуры категорий), режима классификации и количества записей. Производительность узла также сильно зависит от сложности PDL-выражений, которые определяют категории.
Максимальное количество категорий теоретически не ограничено, хотя при работе с 1000 и более категориями работа узла замедляется.
Производительность таксономии зависит от сложности запроса и количества записей в индексированном тексте, а также от среднего числа символов в каждой записи.