Использование узла Производная таблица с узлами регрессии

Узел Производная таблица может быть использован для представления отчета узлов регрессии в виде таблицы данных. Результирующий набор данных будет включать две обязательные колонки – Report section (Раздел отчета) и Target column (Целевая колонка), а также несколько дополнительных колонок в зависимости от выбранного источника.

После того как узел Производная таблица будет добавлен на скрипт и соединен с соответствующим родительским узлом, откройте окно настроек для управления доступными опциями.

На вкладке Настройки используйте выпадающее меню для выбора раздела отчета родительского узла, на основании которого будет составлена результирующая таблица данных:

Все разделы отчета – в качестве источника будут использованы все доступные разделы. Соответствующее количество дополнительных колонок будет добавлено в таблицу данных.

Точность прогноза – в качестве источника будет использован только раздел Точность прогноза. При этом в таблицу данных будет добавлено пять дополнительных колонок:

Standard deviation – характеризует объем рассеивания значений;
Ratio of residual variability – характеризует остаточную изменчивость модели;
R squared – отражает коэффициент детерминации. Подробная информация доступна в разделе R-квадрат.
Support – определяет количество записей, которые были использованы для создания модели;

Significance – отражает значимость терма.

Вышеуказанные колонки соответствуют критериям, которые перечислены на вкладке Точность прогноза в окне просмотра результатов узлов регрессии.

Модель – в качестве источника будет использован только раздел Модель. При этом в таблицу данных будет добавлена одна дополнительная колонка:
- Prediction model – отражает точную формулу для расчета оценки.
Модель MARS (доступно только для узла Многомерные адаптивные регрессионные сплайны в качестве родительского) – в качестве источника будет использован только раздел Модель MARS. При этом в таблицу данных будут добавлены семь дополнительных колонок:
- Base function – содержит идентификатор базисной функции;
- Importance – отражает значимость базисной функции (между 0 и 1);
- Coefficient – содержит коэффициент базисной функции;
- Terms – показывает число термов в базисной функции;
- Variable – содержит переменную термов;
- Categories – содержит имя категорий;
- Variable importance – отражает взвешенную сумму важности для всех базисных функций, в которые входят термы этой переменной.
МНЛ модель (доступно только для узла Логистическая регрессия в качестве родительского) – в качестве источника будет использован только раздел МНЛ модель. При этом в таблицу данных будет добавлено несколько дополнительных колонок. Более подробное описание содержания колонок в разделе Исследование результатов Логистической Регрессии.
Прогнозируемое и фактическое – в качестве источника будет использован только раздел Прогнозируемое и фактическое. При этом в таблицу данных будут добавлены две дополнительных колонки:
- X – содержит реальные значения целевой переменной, использованные в процессе обучения;
- Y – отражает прогнозируемые значения.
Прогнозируемое, фактическое значение и номер записи – в качестве источника будет использован только раздел Прогнозируемое, фактическое значение и номер записи. При этом в таблицу данных будут добавлены три дополнительных колонки:
- Number – содержит номер записи
- X – реальные значения целевой переменной, использованные в процессе обучения,
- Y – прогнозируемые значения
Эффективность классификации – в качестве источника будет использован только раздел Эффективность классификации. При этом в таблицу данных будет добавлено четыре дополнительных колонки:
- Classification error – отображает количество случаев (в процентах) неверной классификации;
- Classification probability – характеризует инверсию ошибки (ошибка);
- Classification failure – отображает количество случаев (в процентах), когда алгоритм не выполнил классификацию;
- Classification efficiency – отображает количество случаев (в процентах), когда алгоритм успешно выполнил классификацию.
Детали классификации – в качестве источника будет использован только раздел Детали классификации. При этом в таблицу данных будет добавлено десять дополнительных колонок. Данные колонки соответствуют тем, что описаны в разделе Использование узла Производная таблица с узлами классификации.
Значимость независимых переменных – в качестве источника будет использован только раздел Значимость независимых переменных. При этом в таблицу данных будет добавлено две дополнительных колонки:
- Feature – содержит значение независимой переменной;
- Significance – показывает значимость независимой переменной.
Описание термов (доступно только при использовании узла Линейная регрессия в качестве родительского) – в качестве источника будет использован только раздел Описание термов. При этом в таблицу данных будет добавлено восемь дополнительных колонок:
- Target – содержит имя целевой колонки;
- Term – отображает имя независимого атрибута;
- TermValueCat – содержит категориальное значение терма;
- TermValueString – содержит строковое значение терма;
- Coefficient – отображает коэффициент терма;
- CoefficientStdDev – содержит значение среднеквадратичного отклонения;
- FRatio – содержит значение распределения Фишера;
- PartInVariance – содержит частичную сумму квадратов.
Матрица ошибок – в качестве источника будет использован только раздел Матрица ошибок. При этом в таблицу данных будет добавлено три дополнительных колонки. Данные колонки соответствуют тем, что описаны в разделе Использование узла Производная таблица с узлами классификации.
Настройки – в качестве источника будет использован только раздел Настройки. При этом в таблицу данных будет добавлено три дополнительных колонки:
- Name – содержит имя параметра;
- Value (num) – содержит значения числового типа;
- Value (str) – содержит значения строкового типа.

Если узел Производная таблица был добавлен на скрипт в более ранних версиях PolyAnalyst, в выпадающем меню Раздел отчета также будет доступен вариант Режим совместимости. При выборе данного режима узел Производная таблица представит результаты в старом формате. Однако если пользователь выберет другую опцию и выполнит узел, элемент Режим совместимости будет безвозвратно исключен из списка.

Для большинства доступных разделов отчета пользователи могут дополнительно указать необходимую Целевую переменную в соответствующем поле. По умолчанию результирующая таблица данных отображает сведения для Всех целевых колонок.