Исследование результатов узла Ближайшие соседи
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server. |
Количество вкладок в выходном отчете узла Ближайшие соседи зависит от типа данных целевой переменной.
Например, если целевая колонка содержит данные числового или целочисленного типа, на выходе узел создаст три вкладки – Оптимизированные параметры БС, Точность прогноза и Настройки.
Первая вкладка отображает результаты оптимизации и селекции, которую выполнил генетический алгоритм:
Величина окрестности – количество ближайших соседей (или отдельных факторов/индивидов в популяции), которые были учтены при составлении прогноза и оптимизации результата.
Алгоритм может принять решение о необходимости расчета степени близости факторов (или расстояния между ними) с тем, чтобы определить, чей "голос" оказывает наибольшее влияние на конечное решение. В статистике такая процедура называется "взвешиванием".
Параметр Взвешивание на основе расстояний на первой вкладке показывает, выполнялось ли подобное взвешивание факторов.
Влиятельные предикторы – те переменные, на основе которых составлен прогноз. На скриншоте выше, например, показано, что из всех независимых колонок из таблицы CarData.csv для прогнозирования количества цилиндров у автомобиля алгоритм решил использовать колонки Displacement и Model.
Вкладка Точность прогноза отображает стандартные критерии результативности прогноза – Стандартное отклонение, R-квадрат, Коэффициент остаточной изменчивости и Поддержку:
Вкладка Настройки отображает текущую конфигурацию и время выполнения узла.
Если целевая колонка содержит булевые или строковые данные, отчет узла будет содержать четыре вкладки – Оптимизированные параметры БС, Эффективность классификации, Матрица ошибок и Настройки.