Рассмотрено расширение платформы TXM для корпусного анализа. Предложено использовать выделение псевдооснов в словах текста на базе метода структурных схем и выявление именных групп в структуре текста для выделения подкорпусов по параметрам. Описаны результаты анализа корпуса экстремистских текстов.
DOI: https://doi.org/10.18127/j20729472-201803-13
PDF статьи в журнале «Системы высокой доступности»: https://npo-echelon.ru/doc/Aktualnie_voprosi_2019.pdf
Лаврентьев А. М., Смирнов И. В., Суворова М. И., Соловьев Ф. Н., Фокина А. И., Чеповский А. М. Создание специальных корпусов текстов на основе расширенной платформы TXM // Системы высокой доступности. 2018. Т. 14. № 3. С. 76-81