Узлы операций с колонками

Узлы операций с колонками выполняют различные действия с колонками:

  • Узел Анонимайзер позволяет изменять значения строковых колонок с целью обезличения данных и сохранения их секретности.

  • Узел Дискретизация выполняет дискретизацию числовой или целочисленной колонки, подобно гистограмме.

  • Узел Нормализация используется для компактного представления многовариантных переменных.

  • Узел Консолидация категорий генерирует новые колонки, содержащие агрегированные значения входных колонок.

  • Узел Производные колонки создает таблицу данных, состоящую из входного массива данных, в который добавляются новые колонки в соответствии с настройками узла.

  • Узел Внешний источник данных предназначен для дополнения исходного датасета данными из внешнего источника.

  • Узел Извлечение терминов создает таблицу данных, содержащую извлеченные термины из исходной текстовой колонки.

  • Узел Фильтрация колонок является полезным инструментом, позволяющим скрывать колонки в таблице данных.

  • Узел Объединение моделей может применять несколько моделей к одной таблице данных.

  • Узел Модификация колонок преобразует исходную таблицу данных: изменяет типы колонок, переименовывает колонки и т. д.

  • Узел Оптическое распознавание символов предназначен для перевода изображений машинописного и печатного текста в электронные текстовые данные.

  • Узел Разбиение создает новую колонку в выходной таблице данных с указанием подмножества, к которому принадлежит каждая исходная запись.

  • Узел Замена категорий создает таблицу данных с одной или несколькими новыми колонками на основе родительского массива данных с учетом заданных настроек преобразования значений.

  • Узел Замена терминов находит и изменяет устойчивые сочетания символов в одной или нескольких строковых или текстовых колонках.

  • Узел REST предназначен для отправки GET/POST/PUT/DELETE-запросов.

  • Узел Применение моделей применяет модель к таблице данных.

  • Узел Фильтрация данных позволяет фильтровать колонки, которые не представляют интереса с точки зрения статистического анализа данных.