Просмотр результатов узла Линейная регрессия
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server.

Окно просмотра результатов узла Линейная регрессия имеет несколько вкладок: Модель, Точность прогноза, Прогнозируемое и фактическое, Прогнозируемое, фактическое значение и номер записи, Описание термов и Настройки.

Вкладка Модель

На вкладке Модель созданная узлом модель отображена в виде SRL-выражения. Эту модель можно скопировать и вставить в выражение колонки узла Производные колонки. Это уравнение используется узлом Применение моделей для оценки записей таблицы данных.

lr model.rus

Правило представляет собой линейное выражение со значениями категориального, логического и строкового типов в составе if-выражений.

Вкладка Точность прогноза

Вкладка Точность прогноза отображает среднеквадратическую ошибку, среднеквадратическое отклонение и R-квадрат. Эти показатели позволяют оценить точность полученной модели.

lr predaccuracy.rus

Обычно уровень значимости выше 3 показывает, что правило не является случайным и действительно свидетельствует о наличии зависимости в данных, и чем больше значение R-квадрата, тем точнее правило. R-квадрат - это удобный критерий для сравнения точности двух правил.

Вкладка Прогнозируемое и фактическое

График на вкладке Прогнозируемое и фактическое отображает соотношение прогнозируемых значений целевой переменной с действительными значениями для каждой строки данных. Вдоль оси Х располагаются реальные значения целевой переменной, использованные в процессе обучения, вдоль оси У - прогнозируемые значения. Для отображения всех точек данных масштаб осей выбирается автоматически.

В идеале все точки на этом графике должны лежать вдоль диагональной линии, что означает идеальный прогноз (каждое прогнозируемое значение целевого атрибута равно действительному значению того же набора исходных атрибутов) или значение R-квадрата, равное 1. Чем дальше точки данных находятся от этой линии (в любом направлении), тем ниже точность прогноза. Если эта линия не проходит ни через одну из точек данных, то значение R-квадрата будет равно 0 или стремиться к нему.

График рассеяния не только отображает расстояние точек данных от диагонали, но и их разброс. Чем больше разброс, тем больше прогнозируемых значений, и тем меньше их точность.

Если бы все точки данных были идеальны (если бы все точки лежали на линии), это означало бы чрезмерную подгонку, и правило было бы бесполезным.

lr predreal.rus
Вкладка Прогнозируемое, фактическое значение и номер записи

График на вкладке Прогнозируемое, фактическое значение и номер записи показывает зависимость прогнозируемых и фактических значений от номера записи.

lr recno.rus
Вкладка Описание термов

Вкладка Описание термов содержит информацию о различных независимых атрибутах, отобранных алгоритмом для конечной модели.

lr terms.rus

F-критерий и частичная сумма квадратов могут использоваться для определения того, какой прогностической способностью обладает каждый терм в линейных отношениях - термы с более высокой частичной суммой квадратов или более высокий критерий Фишера следует учитывать в дальнейшем анализе.