Использование узла Производная таблица с узлами регрессии

Узел Производная таблица может быть использован для представления отчета узлов регрессии в виде таблицы данных. Результирующий набор данных будет включать две обязательные колонки – Report section (Раздел отчета) и Target column (Целевая колонка), а также несколько дополнительных колонок в зависимости от выбранного источника.

После того как узел Производная таблица будет добавлен на скрипт и соединен с соответствующим родительским узлом, откройте окно настроек для управления доступными опциями.

На вкладке Настройки используйте выпадающее меню для выбора раздела отчета родительского узла, на основании которого будет составлена результирующая таблица данных:

  • Все разделы отчета – в качестве источника будут использованы все доступные разделы. Соответствующее количество дополнительных колонок будет добавлено в таблицу данных.

  • Точность прогноза – в качестве источника будет использован только раздел Точность прогноза. При этом в таблицу данных будет добавлено пять дополнительных колонок:

    • Standard deviation – характеризует объем рассеивания значений;

    • Ratio of residual variability – характеризует остаточную изменчивость модели;

    • R squared – отражает коэффициент детерминации. Подробная информация доступна в разделе R-квадрат.

    • Support – определяет количество записей, которые были использованы для создания модели;

    • Significance – отражает значимость терма.

      Вышеуказанные колонки соответствуют критериям, которые перечислены на вкладке Точность прогноза в окне просмотра результатов узлов регрессии.
  • Модель – в качестве источника будет использован только раздел Модель. При этом в таблицу данных будет добавлена одна дополнительная колонка:

    • Prediction model – отражает точную формулу для расчета оценки.

  • Модель MARS (доступно только для узла Многомерные адаптивные регрессионные сплайны в качестве родительского) – в качестве источника будет использован только раздел Модель MARS. При этом в таблицу данных будут добавлены семь дополнительных колонок:

    • Base function – содержит идентификатор базисной функции;

    • Importance – отражает значимость базисной функции (между 0 и 1);

    • Coefficient – содержит коэффициент базисной функции;

    • Terms – показывает число термов в базисной функции;

    • Variable – содержит переменную термов;

    • Categories – содержит имя категорий;

    • Variable importance – отражает взвешенную сумму важности для всех базисных функций, в которые входят термы этой переменной.

  • МНЛ модель (доступно только для узла Логистическая регрессия в качестве родительского) – в качестве источника будет использован только раздел МНЛ модель. При этом в таблицу данных будет добавлено несколько дополнительных колонок. Более подробное описание содержания колонок в разделе Исследование результатов Логистической Регрессии.

  • Прогнозируемое и фактическое – в качестве источника будет использован только раздел Прогнозируемое и фактическое. При этом в таблицу данных будут добавлены две дополнительных колонки:

    • X – содержит реальные значения целевой переменной, использованные в процессе обучения;

    • Y – отражает прогнозируемые значения.

  • Прогнозируемое, фактическое значение и номер записи – в качестве источника будет использован только раздел Прогнозируемое, фактическое значение и номер записи. При этом в таблицу данных будут добавлены три дополнительных колонки:

    • Number – содержит номер записи

    • X – реальные значения целевой переменной, использованные в процессе обучения,

    • Y – прогнозируемые значения

  • Эффективность классификации – в качестве источника будет использован только раздел Эффективность классификации. При этом в таблицу данных будет добавлено четыре дополнительных колонки:

    • Classification error – отображает количество случаев (в процентах) неверной классификации;

    • Classification probability – характеризует инверсию ошибки (ошибка);

    • Classification failure – отображает количество случаев (в процентах), когда алгоритм не выполнил классификацию;

    • Classification efficiency – отображает количество случаев (в процентах), когда алгоритм успешно выполнил классификацию.

  • Детали классификации – в качестве источника будет использован только раздел Детали классификации. При этом в таблицу данных будет добавлено десять дополнительных колонок. Данные колонки соответствуют тем, что описаны в разделе Использование узла Производная таблица с узлами классификации.

  • Значимость независимых переменных – в качестве источника будет использован только раздел Значимость независимых переменных. При этом в таблицу данных будет добавлено две дополнительных колонки:

    • Feature – содержит значение независимой переменной;

    • Significance – показывает значимость независимой переменной.

  • Описание термов (доступно только при использовании узла Линейная регрессия в качестве родительского) – в качестве источника будет использован только раздел Описание термов. При этом в таблицу данных будет добавлено восемь дополнительных колонок:

    • Target – содержит имя целевой колонки;

    • Term – отображает имя независимого атрибута;

    • TermValueCat – содержит категориальное значение терма;

    • TermValueString – содержит строковое значение терма;

    • Coefficient – отображает коэффициент терма;

    • CoefficientStdDev – содержит значение среднеквадратичного отклонения;

    • FRatio – содержит значение распределения Фишера;

    • PartInVariance – содержит частичную сумму квадратов.

  • Матрица ошибок – в качестве источника будет использован только раздел Матрица ошибок. При этом в таблицу данных будет добавлено три дополнительных колонки. Данные колонки соответствуют тем, что описаны в разделе Использование узла Производная таблица с узлами классификации.

  • Настройки – в качестве источника будет использован только раздел Настройки. При этом в таблицу данных будет добавлено три дополнительных колонки:

    • Name – содержит имя параметра;

    • Value (num) – содержит значения числового типа;

    • Value (str) – содержит значения строкового типа.

Если узел Производная таблица был добавлен на скрипт в более ранних версиях PolyAnalyst, в выпадающем меню Раздел отчета также будет доступен вариант Режим совместимости. При выборе данного режима узел Производная таблица представит результаты в старом формате. Однако если пользователь выберет другую опцию и выполнит узел, элемент Режим совместимости будет безвозвратно исключен из списка.

Для большинства доступных разделов отчета пользователи могут дополнительно указать необходимую Целевую переменную в соответствующем поле. По умолчанию результирующая таблица данных отображает сведения для Всех целевых колонок.