Итерация скрипта Python для обработки нескольких исходных таблиц
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server. |
Как говорилось выше, узел Python может быть соединен с несколькими родительскими узлами. Вы можете настроить итерацию скрипта Python для обработки нескольких родительских таблиц.
Например, с помощью узла Python вы можете свести в единую таблицу статистические данные из нескольких исходных таблиц, которые вы планируете использовать в ходе дальнейшего анализа.
Предположим, вы работаете с тремя источниками данных:
В настройках узла появятся три дополнительные вкладки: по одной на каждую исходную таблицу данных.
Используемый в данном случае скрипт будет сложнее, чем в предыдущих примерах.
Структура данных (DataFrame) в библиотеке pandas
представляет собой полноценную таблицу, состоящую из колонок и строк.
Согласно скрипту, каждая запись в создаваемой узлом таблице должна представлять собой объект, чьи свойства описаны в полях Node name
(название узла), Column name
(название колонки) и Records
(записи). Эти поля используются для именования колонок в выходной таблице узла.
В скрипте также используется переменная parents
, которая позволяет узлу последовательно обращаться ко всем родительским таблицам данных.
На вкладках для выбора колонок переместите все колонки из списков доступных колонок в выбранные – это необходимо для решения нашей задачи по созданию своего рода реестра колонок и строк из всех исходных таблиц.
При необходимости снимите флажок Использовать все колонки, КРОМЕ выбранных. |
В результате итеративного выполнения скрипта узел Python создаст таблицу данных из трех колонок:
-
Node name (Имя узла) – колонка с названиями родительских узлов;
-
Column name (Имя колонки) – колонка с названиями всех колонок из всех родительских таблиц;
-
Records (Записи) – колонка с количеством записей в родительских таблицах.