Пример использования узла Замена терминов
Ниже приведен типичный сценарий использования узла.
В этом примере таблица данных состоит из трех колонок, две из которых содержит информацию о поле и возрасте комментаторов, третья – текст. Эта таблица может быть использована в данном случае, поскольку она содержит как минимум одну текстовую колонку, с которой может работать узел Замена терминов.
После соединения, настройки и выполнения узла Замена терминов его выходные данные будут выглядеть следующим образом:
Таблица выходных данных выглядит почти так же, как и исходная таблица, но теперь она содержит дополнительную колонку с именем Comment_rep, которая содержит результаты замен, выполненных во время выполнения узла.
На скрипте узел Замена терминов обычно расположен после узла, импортировавшего данные, и узлов, которые готовят данные. За узлом Замена терминов в цепочке обычно следуют аналитические узлы. На следующем рисунке приведен пример проекта, в котором узел Замена терминов используется для подготовки данных для последующего анализа.
В этом примере первые несколько узлов импортируют данные с комментариями в проект PolyAnalyst. Первая таблица (Комментарии) объединяется с таблицей, содержащей данные по демографии (Данные). Далее мы определяем язык таблиц при помощи узла Определение языка, а затем используем два узла Замена терминов. Первый ищет в комментариях упоминания различных сокращений и аббревиатур и заменяет их соответствующими полными формами. Например, узел находит сокращения "IBM" или "I.B.M." и заменяет их на "International Business Machines". Затем измененный текст поступает во второй узел Замена терминов, где исправляются орфографические ошибки.
Наконец, этот измененный текст поступает в несколько узлов текстового анализа для дальнейшего построения итогового отчета.