Просмотр границ сегментов

Правой кнопкой мыши нажмите на узел на скрипте и выберите опцию Показать. Установленные узлом границы сегментов отображаются в списке на вкладке Таблица.

bin bounds.rus

На рисунке выше мы видим такие значения, как 19 и 27. Для получения этих значений мы использовали колонку Mpg из исходной таблицы CarData.csv в качестве колонки дискретизации. Приведенные здесь значения представляют границы сегментов, т.е. в первый класс входят автомобили низкой топливной экономичности, расходующие галлон бензина на 19 или меньше миль, второй класс составляют автомобили средней топливной экономичности, расходующие галлон на 19-27 миль, третий - наиболее экономичные машины (более 27 миль на галлон).

Вкладка Настройки отображает сведения о сервере и времени выполнения узла.

Производительность и масштабируемость

PolyAnalyst начинает работу с создания новой пустой колонки, которая будет содержать границы сегментов. Затем PolyAnalyst присваивает новой колонке уникальное имя. По умолчанию это имя содержит название исходной колонки, к которому прибавляется суффикс "_bin". Затем узел прочитывает исходную таблицу данных из родительского узла построчно, извлекая значение выбранной в исходной колонки для каждой строки, после чего включает каждую строку в определенный сегмент на основе указанного количества сегментов, а затем сохраняет границы сегментов в новой колонке в зависимости от значения исходной колонки. Это детерминируемый процесс в том смысле, что количество исходных строк известно с самого начала, поэтому индикатор выполнения процесса отобразится в списке задач.

Производительность узла напрямую зависит от количества исходных записей. По сравнению с другими узлами, узел Дискретизация - быстродействующий и масштабируемый узел, ограниченный только тем количеством данных, которое можно сохранить в системе PolyAnalyst. Создание новой колонки с границами сегментов потребует дополнительного пространства на диске, но с учетом того, что речь идет о целочисленной колонке (если таковая настроена), много места не потребуется. PolyAnalyst сохраняет только новую колонку, чтобы оптимально использовать рабочее пространство диска.