Использование узла Производная таблица с узлами классификации

Узел Производная таблица может быть использован для представления отчета узлов классификации в виде таблицы данных. Результирующий набор данных будет включать две обязательные колонки – Report section (Раздел отчета) и Target column (Целевая колонка), а также несколько дополнительных колонок в зависимости от выбранного источника.

После того как узел Производная таблица будет добавлен на скрипт и соединен с соответствующим родительским узлом, откройте окно настроек для управления доступными опциями.

На вкладке Настройки используйте выпадающее меню для выбора раздела отчета родительского узла, на основании которого будет составлена результирующая таблица данных.

  • Все разделы отчета – в качестве источника будут использованы все доступные разделы. Соответствующее количество дополнительных колонок будет добавлено в таблицу данных.

  • Эффективность классификации – в качестве источника будет использован только раздел Эффективность классификации. При этом в таблицу данных будет добавлено четыре дополнительных колонки:

    • Classification error – отображает количество случаев (в процентах) неверной классификации;

    • Classification probability – характеризует инверсию ошибки (100 - ошибка);

    • Classification failure – отображает количество случаев (в процентах), когда алгоритм не выполнил классификацию;

    • Classification efficiency – отображает количество случаев (в процентах), когда алгоритм успешно выполнил классификацию.

      Вышеуказанные колонки соответствуют критериям, которые перечислены на вкладке Эффективность классификации в окне просмотра результатов узлов классификации.
  • Детали классификации – в качестве источника будет использован только раздел Детали классификации. При этом в таблицу данных будет добавлено десять дополнительных колонок:

    • Target (cat) – содержит значение выбранной целевой колонки;

    • # of records – отображает количество исходных записей (поддержку), которые содержат данное значение;

    • Fraction – отображает количество исходных записей (в процентах), которые содержат данное значение;

    • Error – отображает количество случаев, когда модель неверно классифицировала данное значение;

    • Precision – характеризует долю релевантных вхождений среди полученных;

    • Recall – характеризует долю полученных релевантных вхождений;

    • F-score – характеризует меру точности, которая рассчитывается с применением показателей precision и recall;

    • False negative – отображает количество ложноотрицательных результатов (в процентах);

    • False positive – отображает количество ложноположительных результатов (в процентах);

    • Undefined – отображает количество записей (в процентах), которые не были классифицированы.

  • Матрица ошибок – в качестве источника будет использован только раздел Матрица ошибок. При этом в таблицу данных будет добавлено три дополнительных колонки:

    • Actual (cat) – содержит действительный класс (категорию);

    • Predicted (cat) – содержит прогнозируемый класс (категорию);

    • Count – отображает количество записей, которые принадлежат к данной категории;

  • (Недоступно при использовании узлов Линейная классификация и SVM в качестве родительских) Значимость независимых переменных – в качестве источника будет использован только раздел Значимость независимых переменных. При этом в таблицу данных будет добавлено две дополнительных колонки:

    • Feature – содержит значение независимой переменной;

    • Significance – показывает значимость независимой переменной.

  • Основные параметры дерева – отображает простую статистику о размере и форме сгенерированной древовидной модели, вы можете выбрать либо все целевые колонки, либо отдельную колонку;

  • Настройки – в качестве источника будет использован только раздел Настройки. При этом в таблицу данных будет добавлено три дополнительных колонки:

    • Name – содержит имя параметра;

    • Value (num) – содержит значения числового типа;

    • Value (str) – содержит значения строкового типа.

  • Ошибка обучения – показывает номер эпохи обучения модели (например, номер дерева) и значение ошибки.

Если узел Производная таблица был добавлен на скрипт в более ранних версиях PolyAnalyst, в выпадающем меню Раздел отчета также будет доступен вариант Режим совместимости. При выборе данного режима узел Производная таблица представит результаты в старом формате. Однако если пользователь выберет другую опцию и выполнит узел, элемент Режим совместимости будет безвозвратно исключен из списка.

Для большинства доступных разделов отчета пользователи могут дополнительно указать необходимую Целевую переменную в соответствующем поле. По умолчанию результирующая таблица данных отображает сведения для Всех целевых колонок.