Узел Анализ тональности
Данный узел или опция доступны, только если они включены в лицензии PolyAnalyst Server.
sentiment analysis48

Узел Анализ тональности определяет субъект речи, объект оценки и характер самой оценки в тексте.

Субъектом оценки может быть автор текста или другое лицо, чье мнение озвучивается в тексте. Субъект оценки далеко не всегда упоминается в записях, особенно если речь идет о текстах неформальной стилистики (форумы, блоги, социальные сети и др.).

Оценка – это эмоциональное суждение субъекта о теме или предмете, описание эмоциональной реакции на что-то или общая тональность высказывания. Оценка выражает отношение субъекта к некоторому объекту, эмоциональную реакцию на что-либо. При этом объект тональности может быть выражен явно (Отличная погода!) или подразумеваться (Кошмар!).

Объект оценки – то, что оценивается. Объект оценки так же, как и субъект, в тексте присутствует не всегда. Из выявленных объектов автоматически выделяются так называемые головные объекты. Эти слова являются смысловыми центрами фраз, например:

  • Слово персонал во фразе любезный обслуживающий персонал;

  • Слово вкус во фразе вкус зубной пасты;

  • Слово банк во фразе вышеупомянутый банк.

Результаты узла содержат несколько метрик тональности, которые могут использоваться для отчета или анализа структурированного текста.

Что такое анализ тональности текста?

Анализ тональности текста отвечает на вопрос "Какие чувства испытывал говорящий или автор текста в отношении определенного объекта или ситуации?".

С появлением социальных сетей анализ тональности стал популярным способом сбора мнений и оценок того или иного объекта, особенно в таких сферах, где важно знать мнение покупателей о продуктах или услугах. Результаты анализа тональности текста позволяют аналитикам определить достоинства и недостатки продуктов, что, в свою очередь, позволяет повысить качество продукции.

В системе PolyAnalyst анализ тональности текста выполняется с помощью специальных правил на языке XPDL и словарей. Домен текста (его тематическая область) определяет выбор правил, используемых для извлечения тональностей. Правила, используемые для извлечения тональностей в рамках одного домена, не могут быть использованы для другого.

Слово мало само по себе не является ни положительным, ни отрицательным.

В модели "очень" + "мало" + название продукта в домене Restaurants (Рестораны) слово мало имеет отрицательную тональность: "очень мало бекона в сэндвиче".

В домене Technology (Техника) фраза "мало памяти" имеет отрицательную коннотацию, а вот фраза "принтер использует мало чернил" – положительную.

После того, как в зависимости от указанного домена будут определены объекты оценки, PolyAnalyst классифицирует их по аспектам.

Аспекты позволяют учитывать разные способы описания свойств одной и той же сущности в пределах одного тематического домена. Например, к аспекту Персонал относятся следующие слова: специалист, член коллектива, сотрудник, коллега.

Предложение "Бургер был классный, но официант грубил" имеет два аспекта: Еда и Персонал. Оба этих аспекта принадлежат к домену Restaurants (Рестораны).

Система аспектов основана на выделении головных объектов (см. далее).

Соединения на скрипте

В качестве входных данных узел Анализ тональности использует таблицу данных с текстовой колонкой.

sa flowchart common.rus

В качестве узла, предшествующего узлу Анализ тональности, мы рекомендуем использовать узел Индекс. Узел Индекс выполняет парсинг текстовых данных и организует их так, чтобы их обработка была более эффективной. Узел Анализ тональности, как и многие другие текстовые узлы в PolyAnalyst, имеет встроенный механизм индексирования, который работает так же, как и узел Индекс. Однако, помните, что использование узла Индекс до узла Анализ тональности позволяет задавать пользовательские настройки операции индексирования и оптимизировать ее.

Кроме того, следует отметить, что узел Анализ тональности создает отчет с метриками тональности. На основе этого отчета необходимо создать узел Производная таблица, и только потом продолжить анализ найденных метрик. Для того чтобы в ходе дальнейшего анализа можно было использовать колонки исходной таблицы данных, а не только колонки с метриками тональности, вы можете соединить результаты узла Производная таблица с исходной таблицей данных, используя внешнее объединение многих-со-многими по текстовой колонке с помощью узла Объединение.

На приведенной ниже схеме показано оптимальное сочетание узлов, которые позволяют добавить к исходной таблице данных метрики тональности текста для их дальнейшего анализа.

sa flowchart.rus

Для повышения эффективности работы узла Анализ тональности рекомендуется добавлять его после узла Извлечение сущностей, который предварительно извлекает такие сущности, как People, Companies и Organizations, поскольку они часто становятся объектом оценки.