Производительность и масштабируемость узла Сортировка строк
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server.

Во время выполнения узел сначала создает пустую таблицу. Алгоритм сортировки последовательно анализирует все строки исходной таблицы данных за один проход и размещает их в выходной таблице. Поскольку количество строк в исходных данных известно, это – детерминируемый процесс, и в вписке задач отразится индикатор выполнения. После того, как каждая исходная запись будет включена в выходную таблицу, работа узла завершится.

Максимальное количество ключей сортировки практически неограниченно. На практике же максимальное число ключей равно 6 (при средней производительности). Производительность алгоритма сортировки схожа с линейной функцией N ключей * N записей. При сортировке огромного количества данных (10 миллионов записей или больше) производительность зависит от количества операций считывания и записи и от объема доступной оперативной памяти.

Ключи сортировки могут содержать любой тип данных, кроме текстовых. Текстовые колонки могут быть преобразованы в строковые, и тогда первые N знаков также можно использовать для сравнения строк. Порядок расположения ключей не влияет на производительность узла.

Сортировка таблиц при помощи узла Сортировка строк выполняется быстро. С помощью узла Сортировка строк вы можете сортировать большой объем данных. Преимущество данного узла по сравнению обычной сортировкой во время просмотра данных объясняется тем, что система PolyAnalyst способна работать с небольшими буферами записей в оперативной памяти, и сортировка происходит на уровне сервера.

При сортировке во время просмотра данных (при работе с сеткой данных, вместо узла Сортировка строк) используются ресурсы компьютера, на котором запущена клиентская программа, а не Сервер PolyAnalyst. Тем самым, Сервер PolyAnalyst задействован минимально, в то время как клиентская машина работает в полную мощь. Учитывая то, что мощность клиентской машины намного слабее машины, на которой запущен сервер, и что процесс сортировки происходит целиком внутри виртуальной памяти клиентской машины, сортировка во время просмотра данных, использующая клиентскую машину, является менее масштабируемой и более медленной.

Просмотр результатов узла Сортировка строк

Результатом работы узла Сортировка строк является таблица данных. Окно для просмотра результатов узла содержит три стандартные вкладки: Данные, Статистика и Уникальные записи.

Для получения дополнительной информации о возможностях просмотра данных см. раздел Просмотр данных.