Настройка узла Внешний источник данных
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server. |
Перед запуском узла необходимо убедиться, что путь к интерпретатору Python указан администратором в разделе Настройки сервера. |
Окно настроек узла Внешний источник данных содержит три вкладки – Настройки, Фильтр и Общие.
Первое, что необходимо сделать, приступая к настройке узла, – выбрать внешний источник данных на вкладке Настройки. Для этого используйте выпадающее меню Провайдер. Выберите в нем источник данных, из которого вы намерены извлечь недостающие данные. Обратите внимание на то, что Токен API соответствующего провайдера необходимо получить заранее.
Затем в таблице слева выберите колонку, по которой будет выполняться поиск (Входная колонка), и режим обработки (Тип). Значения выбранной колонки могут рассматриваться как:
-
для DaData.ru: наименование компании (режим “name”) или какой-либо идентификатор компании (ИНН/ОГРН) (режим “code”). выбранный режим влияет на вид запроса;
-
для OpenCorporates.com: только наименование компании (режим “name”);
-
в пользовательском скрипте можно указать свои режимы обработки.
Если в этой таблице заполнено несколько строк, поиск будет выполняться до тех пор, пока результат запроса для текущей пары (входная колонка, режим обработки) окажется непустым.
Далее в правой таблице необходимо указать, какие атрибуты (Внешний параметр) нужно извлекать из результатов запросов и в какую колонку (Выходная колонка) сохранять их. Если оставить ячейку с названием выходной колонки незаполненной, результат сохранится в колонку, название которой совпадает с названием соответствующего атрибута (внешнего параметра). При этом, если в исходном датасете уже есть колонка с таким названием, название новой колонки будет содержать числовой постфикс (например, "Название" → "Название (1)"). Однако, если прописать название, совпадающее с исходным, значения исходной колонки будут переписаны.
Кнопка Дополнительные параметры в нижней части вкладки Настройки позволяет настроить форму результирующей таблицы (режим обработки строк – на случай, если для одного запроса нашлось несколько результатов) и число обращений в секунду.
Режим обработки строк может принимать два значения:
-
сохранить – дает команду узлу сохранить число строк исходной таблицы. Все результаты для каждого запроса конвертируются в строки и объединяются через точку с запятой;
-
создать копию – в случае получения множества результатов для одного запроса соответствующие ячейки таблицы клонируются.
Вкладка Фильтр используется для ввода SRL-выражения для фильтрации внешних параметров.
Вкладка Общие используется для указания имени и описания узла.