Использование узла Производная таблица с узлами классификации
Узел Производная таблица может быть использован для представления отчета узлов классификации в виде таблицы данных. Результирующий набор данных будет включать две обязательные колонки – Report section (Раздел отчета) и Target column (Целевая колонка), а также несколько дополнительных колонок в зависимости от выбранного источника.
После того как узел Производная таблица будет добавлен на скрипт и соединен с соответствующим родительским узлом, откройте окно настроек для управления доступными опциями.
На вкладке Настройки используйте выпадающее меню для выбора раздела отчета родительского узла, на основании которого будет составлена результирующая таблица данных.
-
Все разделы отчета – в качестве источника будут использованы все доступные разделы. Соответствующее количество дополнительных колонок будет добавлено в таблицу данных.
-
Эффективность классификации – в качестве источника будет использован только раздел Эффективность классификации. При этом в таблицу данных будет добавлено четыре дополнительных колонки:
-
Classification error – отображает количество случаев (в процентах) неверной классификации;
-
Classification probability – характеризует инверсию ошибки (
100 - ошибка
); -
Classification failure – отображает количество случаев (в процентах), когда алгоритм не выполнил классификацию;
-
Classification efficiency – отображает количество случаев (в процентах), когда алгоритм успешно выполнил классификацию.
Вышеуказанные колонки соответствуют критериям, которые перечислены на вкладке Эффективность классификации в окне просмотра результатов узлов классификации.
-
-
Детали классификации – в качестве источника будет использован только раздел Детали классификации. При этом в таблицу данных будет добавлено десять дополнительных колонок:
-
Target (cat) – содержит значение выбранной целевой колонки;
-
# of records – отображает количество исходных записей (поддержку), которые содержат данное значение;
-
Fraction – отображает количество исходных записей (в процентах), которые содержат данное значение;
-
Error – отображает количество случаев, когда модель неверно классифицировала данное значение;
-
Precision – характеризует долю релевантных вхождений среди полученных;
-
Recall – характеризует долю полученных релевантных вхождений;
-
F-score – характеризует меру точности, которая рассчитывается с применением показателей precision и recall;
-
False negative – отображает количество ложноотрицательных результатов (в процентах);
-
False positive – отображает количество ложноположительных результатов (в процентах);
-
Undefined – отображает количество записей (в процентах), которые не были классифицированы.
-
-
Матрица ошибок – в качестве источника будет использован только раздел Матрица ошибок. При этом в таблицу данных будет добавлено три дополнительных колонки:
-
Actual (cat) – содержит действительный класс (категорию);
-
Predicted (cat) – содержит прогнозируемый класс (категорию);
-
Count – отображает количество записей, которые принадлежат к данной категории;
-
-
(Недоступно при использовании узлов Линейная классификация и SVM в качестве родительских) Значимость независимых переменных – в качестве источника будет использован только раздел Значимость независимых переменных. При этом в таблицу данных будет добавлено две дополнительных колонки:
-
Feature – содержит значение независимой переменной;
-
Significance – показывает значимость независимой переменной.
-
-
Основные параметры дерева – отображает простую статистику о размере и форме сгенерированной древовидной модели, вы можете выбрать либо все целевые колонки, либо отдельную колонку;
-
Настройки – в качестве источника будет использован только раздел Настройки. При этом в таблицу данных будет добавлено три дополнительных колонки:
-
Name – содержит имя параметра;
-
Value (num) – содержит значения числового типа;
-
Value (str) – содержит значения строкового типа.
-
-
Ошибка обучения – показывает номер эпохи обучения модели (например, номер дерева) и значение ошибки.
Если узел Производная таблица был добавлен на скрипт в более ранних версиях PolyAnalyst, в выпадающем меню Раздел отчета также будет доступен вариант Режим совместимости. При выборе данного режима узел Производная таблица представит результаты в старом формате. Однако если пользователь выберет другую опцию и выполнит узел, элемент Режим совместимости будет безвозвратно исключен из списка. |
Для большинства доступных разделов отчета пользователи могут дополнительно указать необходимую Целевую переменную в соответствующем поле. По умолчанию результирующая таблица данных отображает сведения для Всех целевых колонок.