Шаг 6: Создание узла Сравнение отклонений подмножеств

Создайте новый узел Сравнение отклонений подмножеств. В палитре узлов он расположен в разделе Визуализация. Соедините узел Производные колонки с узлом Сравнение отклонений подмножеств. Откройте настройки нового узла. На первой вкладке необходимо выбрать рабочие колонки узла. Пусть колонка Origin будет колонкой разбиения. Это позволит разбить набор данных на подмножества по значению страны происхождения, т.е. мы будем сравнивать машины по стране-производителю.

Переместите колонки Mpg, Cylinders, Displacement, Power, Weight и Acceleration в список выбранных колонок. Значения этих колонок будут распределены на графике в зависимости от страны-производителя.

Включите опцию Нормализовать по стандартному отклонению. Для описания характеристик автомобилей используются разные единицы измерения. Нормализация по стандартному отклонению позволит нам просмотреть распределение значений разных колонок на одной шкале.

Вкладки Срезы и Общие не подлежат обязательной настройке.

Первая позволяет отобразить данные таблицы в виде срезов по значениям отдельных переменных (например, по годам). Вкладка настраивается одинаково во многих графических узлах и описана подробнее в разделе Настройка узла Столбчатая диаграмма.

На вкладке Общие вы можете указать название графика - "Характеристики автомобилей по стране происхождения".

Настройка на этом завершена. Нажмите Выполнить, чтобы запустить узел и создать график. Узел отобразит распределение значений выбранных колонок в результате их разбиения по производителю.

Когда работа завершится (обычно это происходит в течение нескольких секунд после запуска узла), выберите опцию Показать в контекстном меню узла, чтобы открыть окно просмотра результатов. Вы увидите змеевидную диаграмму (см. рис. ниже), которая называется так из-за внешнего сходства со змеей. Ваш график может выглядеть несколько иначе.

snakecharttutorial.rus

Легенда под графиком содержит значения из колонки Origin, а именно: Европа, Япония, США. Легенда описывает значения цветов линий на графике. На представленном выше графике мы можем сравнить распределения каждой колонки в зависимости от страны-производителя автомобиля. Очевидно, что у машин европейского производства меньше цилиндров, более низкое смещение, меньше лошадиных сил, они легче американских. Японские машины обладают наибольшей топливной экономичностью двигателя, за ними следуют машины, произведенные в Европе. Такого рода сравнение можно выполнить с помощью диаграмм узла Сравнение результатов подмножеств. В данном руководстве мы используем диаграмму с параллельными координатами для того, чтобы вы наглядно могли себе представить распределение данных исходной таблицы.

Внешний вид графика можно настроить: пользователь может поменять местами элементы, изменить цвета, масштаб, имя, скрыть легенду и др. Подробнее об этом написано в разделе, посвященном графическим возможностям PolyAnalyst.