Интерпретация результатов узла Нормализация
Выходные данные узла представляют собой обычную таблицу данных. На следующем скриншоте показаны результаты узла, который создал колонки Product – Product1, Product2, … Product1 означает наиболее популярный продукт в покупательской корзине. Product2 означает второй по популярности продукт и так далее.
Производительность и масштабируемость
В первую очередь узел сканирует исходную таблицу. Затем он оценивает действительное число переменных (выбранных продуктов). Если данное число превышает максимальное количество переменных, указанное на этапе настройки узла, и если опция Без потерь информации включена, то вы получите сообщение об ошибке, и выполнение узла прекратится. В противном случае будут выбраны самые часто выбираемые продукты. Далее узел создает необходимое количество категориальных переменных. Во время второго этапа работы с таблицей действительные предпочтения извлекаются и сохраняются в виде новых переменных.