Просмотр и интерпретация результатов узла Облако тегов
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server.

Окно просмотра результатов узла Облако тегов имеет две вкладки — Облако тегов и Детализация. Первая вкладка отображает само облако тегов.

TC view1.rus

Для того чтобы получить это облако, мы использовали в качестве примера одну из тренировочных таблиц — файл PatientData.csv. Этот файл содержит информацию, предоставленную крупной страховой компанией. Каждая строка таблицы содержит данные о договоре об оказании медицинской помощи, дату обращения, ID пациента, ID поставщика услуг и др.

Колонку с индивидуальным кодом пациентов (PatientID) мы выбрали в качестве источника ключевых слов (тегов), остальные колонки исходной таблицы переместили в поле выбранных колонок.

Панель инструментов настройки облака по умолчанию скрыта. Для того, чтобы ее отобразить, правой кнопкой мыши нажмите на окно с результатами и узла и выберите опцию Показать панель инструментов.

Панель инструментов облака позволяет изменять цвет и размер тегов. На цветовой шкале красный цвет обозначает минимальное значение выбранного параметра, синий — максимальное. Все выбранные колонки отображаются в выпадающих меню Цвет и Размер. Рядом с ними находятся выпадающие меню с функциями агрегации для каждого параметра (Количество значений, Минимум, Максимум, Сумма, Диапазон, Среднее, Стандартное отклонение). Цифровая шкала справа от опции Размер показывает минимальное и максимальное значения для выбранного параметра.

Например, на рисунке выше видно, что минимальное количество упоминаний ID одного пациента в таблице данных — 163. Его код можно легко увидеть из-за самого маленького шрифта. Максимальное количество раз (860) встречается тег M5Xh1fLTS (он оформлен самым крупным синим шрифтом в центре облака). Пациент с этим кодом заключил наибольшее количество договоров об оказании медицинских услуг за отчетный период. Данный вывод сделан на основе простого подсчета количества записей с кодом данного пациента в исходной таблице данных.

Используя слайдер цифровой шкалы, пользователь может установить минимальную и максимальную границы выбранного параметра, в результате чего некоторые теги, находящиеся за пределами установленного диапазона, будут скрыты.

Если установить курсор в любом месте облака и нажать правую кнопку мыши, откроется меню с дополнительными опциями настройки облака тегов:

TC view3.rus

Эти опции позволяют выполнить следующие действия:

  • Показать панель инструментов — позволяет отображать и скрывать панель инструментов над облаком тегов;

  • Свойства — позволяет настраивать различные опции шрифта;

  • Разрешить вертикальное размещение слов — позволяет располагать некоторые слова в облаке вертикально;

  • Разрешить запись фраз в две строки — позволяет записывать фразы, например, 'police officer', в две строки.

Данная группа настроек носит факультативный характер.

Для того, чтобы выполнить детализацию и увидеть количество записей под тем или иным тегом, необходимо навести курсор на тег и щелкнуть по нему левой кнопкой мыши. Цвет тега при этом изменится на черный, под ним появится подчеркивание. Затем нужно перейти на вкладку Детализация. Если не выбрать тег, вкладка Детализация окажется пустой.

Таблица на вкладке Детализация представляет собой стандартную сетку данных, с которой мы часто имеем дело при просмотре результатов узлов PolyAnalyst. Здесь имеются вкладки Данные, Статистика и Уникальные записи. Подробная информация о возможностях взаимодействия с ними представлена в разделе Просмотр данных.

Вернувшись к вкладке Облако тегов и изменив некоторые параметры его отображения, вы можете визуально представить взаимосвязь данных разных колонок в таблице.

Если, например, вы хотите проследить взаимосвязь между ID пациента, датами обращений и чистой суммой платежей, которую страховая компания перевела поставщику медицинских услуг, можно выбрать колонку Дата оказания услуги (ServiceDate) в качестве регулятора цвета (функция Минимум), и колонку Платеж нетто (NetPayment) в качестве регулятора размера (функция Сумма). В результате получим следующее облако тегов:

TC view2.rus

Данное облако позволяет утверждать, что, во-первых, все пациенты, в основном, уже давно пользуются услугами данной страховой компании, за исключением одного (его ID обозначен синим шрифтом). Во-вторых, облако тегов показывает, за обслуживание каких пациентов компания заплатила наибольшую сумму (большие теги в центре облака).

В рассмотренном примере полученные результаты могут обратить внимание аналитиков на страховые истории отдельных пациентов и лечь в основу дальнейшего анализа.