Производительность и масштабируемость

В ходе выполнения узла PolyAnalyst генерирует выходную таблицу данных и добавляет к исходной таблице новую колонку, которая изначально является пустой. Затем узел выделяет заданное количество подмножеств в исходной таблице данных, выбирая записи в случайном порядке. Степень выполнения задачи определяется в зависимости от соотношения количества записей, которые распределены по подмножествам, и общего количества записей в исходной таблице. В новой колонке выходной таблицы сохраняется ID каждого подмножества. После того, как все записи распределены по подмножествам, узел завершает свою работу.

Узел Разбиение выполняет минимальное количество операций — создание случайной выборки и сохранение идентификаторов подмножеств в новой колонке. Эти операции выполняются быстро. Записи исходной таблицы сохраняются в буферы, поэтому нагрузка на оперативную память минимальна. Ограничения в работе узла Разбиение зависят только от того объема данных, которые PolyAnalyst может сохранить.