Исследование результатов узла Ближайшие соседи
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server.

Количество вкладок в выходном отчете узла Ближайшие соседи зависит от типа данных целевой переменной.

Например, если целевая колонка содержит данные числового или целочисленного типа, на выходе узел создаст три вкладки – Оптимизированные параметры БС, Точность прогноза и Настройки.

Первая вкладка отображает результаты оптимизации и селекции, которую выполнил генетический алгоритм:

cbr view1.rus

Величина окрестности – количество ближайших соседей (или отдельных факторов/индивидов в популяции), которые были учтены при составлении прогноза и оптимизации результата.

Алгоритм может принять решение о необходимости расчета степени близости факторов (или расстояния между ними) с тем, чтобы определить, чей "голос" оказывает наибольшее влияние на конечное решение. В статистике такая процедура называется "взвешиванием".

Например, если семь знакомых человека приобрели товар и рассказали ему об этом, то он может тоже задуматься о покупке. Но при этом если один близкий друг откажется от покупки товара и аргументирует свою позицию, то это человек также наверняка не купит товар: для любого человека мнение его близких друзей и родственников важнее мнения случайных знакомых. В таком случае можно говорить о том, что "вес" мнения одного друга больше "веса" мнений семи знакомых.

Параметр Взвешивание на основе расстояний на первой вкладке показывает, выполнялось ли подобное взвешивание факторов.

Влиятельные предикторы – те переменные, на основе которых составлен прогноз. На скриншоте выше, например, показано, что из всех независимых колонок из таблицы CarData.csv для прогнозирования количества цилиндров у автомобиля алгоритм решил использовать колонки Displacement и Model.

Вкладка Точность прогноза отображает стандартные критерии результативности прогноза – Стандартное отклонение, R-квадрат, Коэффициент остаточной изменчивости и Поддержку:

cbr view2.rus

Вкладка Настройки отображает текущую конфигурацию и время выполнения узла.

Если целевая колонка содержит булевые или строковые данные, отчет узла будет содержать четыре вкладки – Оптимизированные параметры БС, Эффективность классификации, Матрица ошибок и Настройки.