Использование узла Производная таблица с узлом Извлечение терминов

При подключении к узлу Извлечение терминов узел Производная таблица может создать четыре разных таблицы данных.

gd extract terms.rus

В окне настроек свойств узла перейдите на вкладку Настройки и выберите подходящий тип таблицы в выпадающем списке:

  • Список терминов – результирующая таблица данных будет состоять из одной колонки (при условии, что дополнительные колонки не были включены вручную), где каждое уникальное соответствие будет представлено в виде отдельной строки.

  • Строки с извлеченными данными – результирующая таблица данных будет включать колонки родительской таблицы данных, а также колонку Extracted text (Извлеченный текст), где каждое соответствие будет представлено в виде отдельной строки.

При выборе режима Список терминов или Строки с извлеченными данными пользователи могут управлять отображением дополнительных колонок:

  • Имена правил – содержит имя правила;

  • Поддержка – указывает на количество записей, в которых обнаружено текущее соответствие;

  • Частота – указывает на общее количество обнаруженных в записях соответствий.

  • Колонки с извлеченными данными – результирующая таблица данных будет включать колонки родительской таблицы данных, а также дополнительные колонки – по одной для каждого уникального соответствия.

  • Колонки с именами правил – результирующая таблица данных будет включать колонки родительской таблицы данных, а также дополнительные колонки – по одной для каждого правила.

Для режимов Колонки с извлеченными данными и Колонки с именами правил пользователю необходимо указать тип значений в создаваемых узлом колонках:

  • Да/Нет – колонки будут содержать значения yes и no в зависимости от того, найдено ли в записи текущее соответствие/соответствует ли запись текущему правилу. Данный тип выбран по умолчанию.

  • Поддержка – колонки будут содержать целочисленные значения, характеризующие меру поддержки для текущего соответствия или правила.

  • Частота – колонки будут содержать целочисленные значения, характеризующие меру частоты для текущего соответствия или правила.