Производительность узла Линейная регрессия
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server.

Максимально возможное количество независимых переменных - 1000.

В процессе выполнения узла PolyAnalyst разрабатывает модель линейной регрессии входных данных. Это недетерминированный процесс, поэтому индикатор состояния отсутствует. Процесс завершится после окончания обучения модели.

Записи, в которых целевой атрибут равен нулю, игнорируются.

Теоретически, узел Линейная регрессия может принять максимальный набор данных, который PolyAnalyst способен сохранить на входе. Дополнительные записи линейно увеличивают время обработки. Если записей менее 30, результат вряд ли будет сколько-нибудь значимым.

Максимально возможное количество атрибутов - 3000, рекомендуется использовать от 5 до 30 атрибутов. Минимальное количество атрибутов - 1. Дополнительные атрибуты линейно увеличивают время работы узла.

При наличии 30 атрибутов и 10000 записей процессор с частотой 1,5 ГГц завершит исследовательский процесс за 14 секунд с выполнением рандомизированного тестирования, и за 3 секунды - без него.

Введение значения Критического F-критерия значительно влияет на скорость вычислительного процесса. Во время тестирования модели Критический F-критерий был равен 10, именно такое значение рекомендуется для больших таблиц данных. При введении меньшего значения время вычисления значительно увеличится.

Если объем доступной оперативной памяти ограничен, пользователи могут использовать выборки из крупных таблиц данных.

Ранжирование набора данных с помощью модели линейной регрессии выполняется с той же скоростью, с которой PolyAnalyst оценивает SRL-выражение в узле Производные колонки.

При выполнении регрессионного анализа идеальное соотношение случайных и независимых переменных составляет 20:1, где 20 - число случайных величин, 1 - независимая переменная. Минимально допустимое соотношение - 5:1, где на 5 случайных переменных в модели приходится 1 независимая переменная.