kwic
Назначение
Функция kwic возвращает текстовое значение, содержащее специальные слова вместе с контекстом этих слов. Название kwic - сокращение от keyword-in-context (ключевые слова в контексте).
Анализ kwic - это известный метод сообщения результатов анализа ключевых слов. Традиционно отчет kwic состоит из списка терминов, извлеченных из документа, где каждый элемент списка - особое включение слова; также для каждого слова включается некоторое количество текста до и после него. Следовательно, kwic в целом рассматривается как форма контекстуального анализа, где основное внимание уделяется исследованию текста с интересующими ключевыми словами. Исследование контекста может дать некоторые полезные сведения и помочь устранить некоторые неоднозначности в значении терминов при выполнении семантического анализа.
Функция kwic не производит отчет, но производит новое значение, которое при использовании в выражении новой колонки узла Производные колонки, может применяться для генерирования таблицы, которая может дать необходимые данные для генерирования отчета.
Аргументы
Функция требует наличия пяти аргументов:
-
Первый аргумент - это строка, которая представляет входное текстовое значение. Обычно это текстовая колонка из таблицы.
-
Второй аргумент - это список целевых терминов, разграниченный точкой с запятой. Необходимо указать минимум один термин. Если указан только один термин, не нужно указывать конечную точку с запятой.
-
Третий аргумент - целое число, которое означает расстояние, а именно максимальное расстояние. Расстояние означает число слов/токенов, которое нужно включить в результаты функции. Расстояние применяется отдельно к предшествующему и конечному контексту.
-
Четвертый аргумент - целое число. Используются только числа 0 и 1. Этот аргумент управляет тем, что функция считает включением целевого термина (из второго аргумента).
-
Значение 0 означает точное соответствие
-
Значение 1 - либо точное соответствие, либо одно из действительных альтернативных морфологических значений целевого термина.
При нахождении точного соответствия функция ищет только те включения, в которых целевой термин представлен точно так же, как и во втором аргументе.
При использовании морфологического расширения функция ищет и точное включение термина, и включения любых его морфологических форм (например, множественное число, единственное число, притяжательный падеж).
-
-
Пятый аргумент - разграничивающий символ или строка, которая используется для разделения соответствий в получившейся строке.