Использование узла Производная таблица с узлами регрессии
Узел Производная таблица может быть использован для представления отчета узлов регрессии в виде таблицы данных. Результирующий набор данных будет включать две обязательные колонки – Report section (Раздел отчета) и Target column (Целевая колонка), а также несколько дополнительных колонок в зависимости от выбранного источника.
После того как узел Производная таблица будет добавлен на скрипт и соединен с соответствующим родительским узлом, откройте окно настроек для управления доступными опциями.
На вкладке Настройки используйте выпадающее меню для выбора раздела отчета родительского узла, на основании которого будет составлена результирующая таблица данных:
-
Все разделы отчета – в качестве источника будут использованы все доступные разделы. Соответствующее количество дополнительных колонок будет добавлено в таблицу данных.
-
Точность прогноза – в качестве источника будет использован только раздел Точность прогноза. При этом в таблицу данных будет добавлено пять дополнительных колонок:
-
Standard deviation – характеризует объем рассеивания значений;
-
Ratio of residual variability – характеризует остаточную изменчивость модели;
-
R squared – отражает коэффициент детерминации. Подробная информация доступна в разделе R-квадрат.
-
Support – определяет количество записей, которые были использованы для создания модели;
-
Significance – отражает значимость терма.
Вышеуказанные колонки соответствуют критериям, которые перечислены на вкладке Точность прогноза в окне просмотра результатов узлов регрессии.
-
-
Модель – в качестве источника будет использован только раздел Модель. При этом в таблицу данных будет добавлена одна дополнительная колонка:
-
Prediction model – отражает точную формулу для расчета оценки.
-
-
Модель MARS (доступно только для узла Многомерные адаптивные регрессионные сплайны в качестве родительского) – в качестве источника будет использован только раздел Модель MARS. При этом в таблицу данных будут добавлены семь дополнительных колонок:
-
Base function – содержит идентификатор базисной функции;
-
Importance – отражает значимость базисной функции (между 0 и 1);
-
Coefficient – содержит коэффициент базисной функции;
-
Terms – показывает число термов в базисной функции;
-
Variable – содержит переменную термов;
-
Categories – содержит имя категорий;
-
Variable importance – отражает взвешенную сумму важности для всех базисных функций, в которые входят термы этой переменной.
-
-
МНЛ модель (доступно только для узла Логистическая регрессия в качестве родительского) – в качестве источника будет использован только раздел МНЛ модель. При этом в таблицу данных будет добавлено несколько дополнительных колонок. Более подробное описание содержания колонок в разделе Исследование результатов Логистической Регрессии.
-
Прогнозируемое и фактическое – в качестве источника будет использован только раздел Прогнозируемое и фактическое. При этом в таблицу данных будут добавлены две дополнительных колонки:
-
X – содержит реальные значения целевой переменной, использованные в процессе обучения;
-
Y – отражает прогнозируемые значения.
-
-
Прогнозируемое, фактическое значение и номер записи – в качестве источника будет использован только раздел Прогнозируемое, фактическое значение и номер записи. При этом в таблицу данных будут добавлены три дополнительных колонки:
-
Number – содержит номер записи
-
X – реальные значения целевой переменной, использованные в процессе обучения,
-
Y – прогнозируемые значения
-
-
Эффективность классификации – в качестве источника будет использован только раздел Эффективность классификации. При этом в таблицу данных будет добавлено четыре дополнительных колонки:
-
Classification error – отображает количество случаев (в процентах) неверной классификации;
-
Classification probability – характеризует инверсию ошибки (ошибка);
-
Classification failure – отображает количество случаев (в процентах), когда алгоритм не выполнил классификацию;
-
Classification efficiency – отображает количество случаев (в процентах), когда алгоритм успешно выполнил классификацию.
-
-
Детали классификации – в качестве источника будет использован только раздел Детали классификации. При этом в таблицу данных будет добавлено десять дополнительных колонок. Данные колонки соответствуют тем, что описаны в разделе Использование узла Производная таблица с узлами классификации.
-
Значимость независимых переменных – в качестве источника будет использован только раздел Значимость независимых переменных. При этом в таблицу данных будет добавлено две дополнительных колонки:
-
Feature – содержит значение независимой переменной;
-
Significance – показывает значимость независимой переменной.
-
-
Описание термов (доступно только при использовании узла Линейная регрессия в качестве родительского) – в качестве источника будет использован только раздел Описание термов. При этом в таблицу данных будет добавлено восемь дополнительных колонок:
-
Target – содержит имя целевой колонки;
-
Term – отображает имя независимого атрибута;
-
TermValueCat – содержит категориальное значение терма;
-
TermValueString – содержит строковое значение терма;
-
Coefficient – отображает коэффициент терма;
-
CoefficientStdDev – содержит значение среднеквадратичного отклонения;
-
FRatio – содержит значение распределения Фишера;
-
PartInVariance – содержит частичную сумму квадратов.
-
-
Матрица ошибок – в качестве источника будет использован только раздел Матрица ошибок. При этом в таблицу данных будет добавлено три дополнительных колонки. Данные колонки соответствуют тем, что описаны в разделе Использование узла Производная таблица с узлами классификации.
-
Настройки – в качестве источника будет использован только раздел Настройки. При этом в таблицу данных будет добавлено три дополнительных колонки:
-
Name – содержит имя параметра;
-
Value (num) – содержит значения числового типа;
-
Value (str) – содержит значения строкового типа.
-
Если узел Производная таблица был добавлен на скрипт в более ранних версиях PolyAnalyst, в выпадающем меню Раздел отчета также будет доступен вариант Режим совместимости. При выборе данного режима узел Производная таблица представит результаты в старом формате. Однако если пользователь выберет другую опцию и выполнит узел, элемент Режим совместимости будет безвозвратно исключен из списка. |
Для большинства доступных разделов отчета пользователи могут дополнительно указать необходимую Целевую переменную в соответствующем поле. По умолчанию результирующая таблица данных отображает сведения для Всех целевых колонок.