Производительность и масштабируемость

Во время выполнения узла PolyAnalyst создает выходную таблицу данных, последовательно оценивает все записи в исходной таблице данных и применяет к ним выбранный пользователем метод создания выборки. Этот процесс является детерминируемым и во время выполнения узла ход выполнения задачи будет отображаться в списке задач.

Узел Выборка может работать с максимальным количеством строк и колонок, которые PolyAnalyst может хранит в исходной таблице данных. Скорость работы узла Выборка линейно зависит от количества записей в исходной таблице и, как правило, не зависит от выбранного метода создания выборки. Метод Выборочное подмножество является наиболее быстрым. Метод 1 строка из N записей менее быстрый. Самый медленный из трех – метод Случайные строки. Создание выборки данных – быстрая и масштабируемая операция, не требующая большого объема RAM.