TITANIS и EMOPSYCHOMETR

Инструменты интеллектуального анализа текстов для оценки психоэмоционального состояния авторов

TITANIS — это набор текстовых параметров и методов обработки естественного языка для оценки психоэмоционального состояния авторов текстов и сообществ социальных медиа. В его основе лежат результаты многолетних исследований ФИЦ ИУ РАН на стыке психологии, филологии, лингвистики и искусственного интеллекта. Помимо широко используемых подходов обработки естественного языка, таких как tf-idf и анализ тональности, TITANIS включает в себя психолингвистический, семантический, дискурсивный и другие виды анализа, которые позволяют обнаруживать различия в текстах пользователей с разными психоэмоциональными состояниями.

TITANIS выполняет более «тонкий» и более эффективный по сравнению с аналогами анализ текстов за счёт использования интерпретируемых психолингвистических текстовых показателей, взятых из клинической психиатрии, а также за счёт учёта глубоких уровней языка, таких как синтаксис, семантика и дискурс. В частности, с помощью него можно с большой точностью определять реакцию индивидуумов или целых сообществ на значимые социальные и общественно-политические события.

Некоторые функции TITANIS реализованы впервые в мире: в частности, выявление реакции на фрустрацию. Ряд других функций являются инновационными для русского языка, например, учёт дискурса, определение фрустрированности, депрессивности и причины эмоций. Эффективность алгоритмов TITANIS подтверждена многочисленными экспериментами на реальном текстовом материале.

Пробная версия программы на GitHub

 

Основные функциональные возможности

 

 
Расчёт психолингвистических маркеров

TITANIS позволяет рассчитывать морфологические и психолингвистические параметры текста, характеризующие эмоциональное состояния автора. В состав маркеров входят различные психолингвистические коэффициенты, морфологические параметры текста, синтаксические параметры связности предложений и дискурсивные параметры связности текста. Отличие TITANIS от аналогов заключается в учёте глубоких уровней языка: синтаксического, семантического и дискурсивного. Психолингвистические маркеры используются совместно с другими методиками для более точного определения психоэмоционального состояния человека.

 

 
Выявление эмоциональной направленности текста

TITANIS позволяет оценить эмоциональную напряжённость автора на момент написания текста, его склонность к эмоциональному или рациональному отношению к обсуждаемому в тексте предмету, готовность к действию (в том числе, агрессивному), а также к просоциальному или асоциальному поведению. В состав инструмента входят специализированные словари лексики определённых тематических категорий и лексики, характеризующей отношение автора текста к упоминаемым предметам. На основе данных словарей рассчитывается встречаемость подобной лексики в заданном тексте. Всего в TITANIS используется 21 словарь.

 

 
Выявление типов эмоционального состояния

В TITANIS одним из важнейших показателей для определения эмоционального состояния автора является использование эмотивных предикатов. Они разделены на четыре семантических подкласса: позитивы, негативы, амбиваленты и деэмотивы.

В основу разграничения положен признак позитивной/негативной эмоциональной окрашенности, дополненный признаком амбивалентного характера. Наконец, выделена подгруппа глаголов, которые относятся к эмотивным, но обозначают не нахождение в эмоциональном состоянии, а выход из него, отсутствие повышенного эмоционального фона. При анализе учитывается преобразование, которое совершается с семантикой глагола в контексте отрицания.

 

 
Выявление базовых эмоций

На основе специализированных словарей TITANIS позволяет выявить в тексте такие базовые эмоции как страх, гнев, печаль, радость и удивление. Ведутся работы по созданию алгоритма распознавания эмоций социальной оценки (презрение, стыд, вина, смущение, гордость, уважение).

 

 
Выявление субъекта и причины эмоций

TITANIS позволяет определить по тексту кто [субъект] и от чего или почему [причина] испытывает эмоции: например, Мы [субъект] обрадовались подарку [причина]. Эта задача решается на основе семантического анализа текста, устанавливающего семантические роли в предикатно-аргументных конструкциях при предикатах эмоций и агрессии. Причину (эмоции или агрессии) выражает семантическая роль каузатив, субъекта (эмоции или агрессии) выражает семантическая роль экспериенцер.

 

 
Предсказание наличия признаков депрессии у автора текста по его небольшому сочинению

TITANIS позволяет получить оценку наличия признаков депрессии (болезни) у автора текста по небольшому сочинению о себе. Предсказание основано на модели машинного обучения, которая была обучена на сочинениях людей с клинической депрессией и людей без признаков ментальных расстройств.

 

 
Предсказание наличия признаков депрессивности у автора текста по текстовым сообщениям социальных сетей

TITANIS позволяет получить предсказание наличия признаков депрессивности (как черты характера, а не болезни) у автора текста коротких сообщений, оставленных в социальных сетях или мессенджерах. Оно основано на машинном обучении на коллекциях текстовых сообщений пользователей сети Вконтакте, которые прошли опросник депрессии Бека.

 

 
Предсказание наличия состояния фрустрации у автора текста

Фрустрация — это психическое состояние, вызванное неуспехом в удовлетворении потребности или желания, наличием барьера на пути к достижению цели, что может привести к дезорганизации деятельности и снижению её эффективности. TITANIS позволяет получить предсказание, был ли текст написан автором в состоянии фрустрации или нет. Предсказание основывано на модели машинного обучения, обученной при помощи ста пользователей социальных сетей, оставивших текстовые сообщения в спокойном или фрустрированном состояниях.

 

 
Выявление типа реакции на фрустрацию по Розенцвейгу

В настоящий момент в TITANIS реализована функция распознавания по тексту таких полярных вариантов реагирования на препятствие как игнорирование и агрессия. Алгоритм применим как для оценки единичных реакций одного автора, так и для описания реакций целевой группы на потенциально неблагоприятные события.

Ведутся работы по созданию алгоритма распознавания всех девяти вариантов фрустрационного реагирования, описанных Розенцвейгом. Применение алгоритма полного распознавания позволит численно характеризовать все встретившиеся в заданном фрагменте текста типы реакций. Например, определять по записям диалогов клиента с оператором привычную для клиента/оператора реакцию на проблемную ситуацию, или определять по комментариям на сайте или странице в соцсетях преобладающую реакцию пользователей на изменения в условиях оказаниях услуг.

 

 

Публикации о TITANIS

 

1. TITANIS: Инструмент для интеллектуального анализа текста из социальных сетей. URL: https://rairi.frccsc.ru/publications/186

2. Метод реляционно-ситуационного анализа текста в психологических исследованиях. URL: https://rairi.frccsc.ru/publications/333

3. Программные средства психоэмоционального анализа текстов. URL: https://rairi.frccsc.ru/publications/316

 

 

Презентации

TITANIS

EMOPSYCHOMETR