TITANIS

A tool for intelligent text analysis in social media

TITANIS offers an expanded set of text parameters and natural language processing methods designed to measure psycho-emotional state of social media users and communities. Behind this tool are years and years of Academy's research into psychology, philology, linguistics, and AI. In addition to the widely applied NLP approaches, such as tf-idf and sentiment analysis, TITANIS includes psycholinguistic, semantic, discursive, and other types of analysis that allow to detect more peculiarities in the texts of users with different psycho-emotional states.

In comparison to other tools, TITANIS allows to perform more delicate and effective text mining by applying interpretable psycholinguistic text data borrowed from clinical psychiatry and keeping record of language levels such as syntax, semantics, and discourse. It is possible, among other things, to detect reactions of both individuals and whole communities to important social and political events with great precision.

Some of the functions of TITANIS are introduced for the first time in the world, including detection of frustration reactions. A number of other functions are completely innovative for the Russian language, for example, discourse analysis, frustration detection, depression, and the cause of emotions. Algorithmic efficiency of TITANIS has been approved by multiple experiments conducted on real text material.

 

Main features:

 

 
Расчёт психолингвистических маркеров

TITANIS позволяет рассчитывать морфологические и психолингвистические параметры текста, характеризующие эмоциональное состояния автора. В состав маркеров входят различные психолингвистические коэффициенты, морфологические параметры текста, синтаксические параметры связности предложений и дискурсивные параметры связности текста. Отличие TITANIS от аналогов заключается в учёте глубоких уровней языка: синтаксического, семантического и дискурсивного. Психолингвистические маркеры используются совместно с другими методиками для более точного определения психоэмоционального состояния человека.

 

 
Выявление эмоциональной направленности текста

TITANIS позволяет оценить эмоциональную напряжённость автора на момент написания текста, его склонность к эмоциональному или рациональному отношению к обсуждаемому в тексте предмету, готовность к действию (в том числе, агрессивному), а также к просоциальному или асоциальному поведению. В состав инструмента входят специализированные словари лексики определённых тематических категорий и лексики, характеризующей отношение автора текста к упоминаемым предметам. На основе данных словарей рассчитывается встречаемость подобной лексики в заданном тексте. Всего в TITANIS используется 21 словарь.

 

 
Выявление типов эмоционального состояния

В TITANIS одним из важнейших показателей для определения эмоционального состояния автора является использование эмотивных предикатов. Они разделены на четыре семантических подкласса: позитивы, негативы, амбиваленты и деэмотивы.

 

В основу разграничения положен признак позитивной/негативной эмоциональной окрашенности, дополненный признаком амбивалентного характера. Наконец, выделена подгруппа глаголов, которые относятся к эмотивным, но обозначают не нахождение в эмоциональном состоянии, а выход из него, отсутствие повышенного эмоционального фона. При анализе учитывается преобразование, которое совершается с семантикой глагола в контексте отрицания.

 

 
Выявление базовых эмоций

На основе специализированных словарей TITANIS позволяет выявить в тексте такие базовые эмоции как страх, гнев, печаль, радость и удивление. Ведутся работы по созданию алгоритма распознавания эмоций социальной оценки (презрение, стыд, вина, смущение, гордость, уважение).

 

 
Выявление субъекта и причины эмоций

TITANIS позволяет определить по тексту кто [субъект] и от чего или почему [причина] испытывает эмоции: например, Мы [субъект] обрадовались подарку [причина]. Эта задача решается на основе семантического анализа текста, устанавливающего семантические роли в предикатно-аргументных конструкциях при предикатах эмоций и агрессии. Причину (эмоции или агрессии) выражает семантическая роль каузатив, субъекта (эмоции или агрессии) выражает семантическая роль экспериенцер.

 

 
Предсказание наличия признаков депрессии у автора текста по его небольшому сочинению

TITANIS позволяет получить оценку наличия признаков депрессии (болезни) у автора текста по небольшому сочинению о себе. Предсказание основано на модели машинного обучения, которая была обучена на сочинениях людей с клинической депрессией и людей без признаков ментальных расстройств.

 

 
Предсказание наличия признаков депрессивности у автора текста по текстовым сообщениям социальных сетей

TITANIS позволяет получить предсказание наличия признаков депрессивности (как черты характера, а не болезни) у автора текста коротких сообщений, оставленных в социальных сетях или мессенджерах. Оно основано на машинном обучении на коллекциях текстовых сообщений пользователей сети Вконтакте, которые прошли опросник депрессии Бека.

 

 
Предсказание наличия состояния фрустрации у автора текста

Фрустрация — это психическое состояние, вызванное неуспехом в удовлетворении потребности или желания, наличием барьера на пути к достижению цели, что может привести к дезорганизации деятельности и снижению её эффективности. TITANIS позволяет получить предсказание, был ли текст написан автором в состоянии фрустрации или нет. Предсказание основывано на модели машинного обучения, обученной при помощи ста пользователей социальных сетей, оставивших текстовые сообщения в спокойном или фрустрированном состояниях.

 

 
Выявление типа реакции на фрустрацию по Розенцвейгу

В настоящий момент в TITANIS реализована функция распознавания по тексту таких полярных вариантов реагирования на препятствие как игнорирование и агрессия. Алгоритм применим как для оценки единичных реакций одного автора, так и для описания реакций целевой группы на потенциально неблагоприятные события.

 

Ведутся работы по созданию алгоритма распознавания всех девяти вариантов фрустрационного реагирования, описанных Розенцвейгом. Применение алгоритма полного распознавания позволит численно характеризовать все встретившиеся в заданном фрагменте текста типы реакций. Например, определять по записям диалогов клиента с оператором привычную для клиента/оператора реакцию на проблемную ситуацию, или определять по комментариям на сайте или странице в соцсетях преобладающую реакцию пользователей на изменения в условиях оказаниях услуг.