В статье представлены результаты исследования в области методов тематической кластеризации научно-технических документов. Сформулированы требования к реализации методов кластеризации масштабных коллекций документов в поисково-аналитических системах. Предложен метод и разработан алгоритм тематической кластеризации масштабных коллекций научно-технических документов в поисково-аналитической системе. Выполнено экспериментальное сравнение результатов работы предложенного метода с несколькими классическими методами кластеризации текстов.
Девяткин Д. А., Суворов Р. Е., Соченков И. В. Распределенная тематическая кластеризация текстовых документов в системе EXACTUS EXPERT // Труды V Международной конференции «Системный анализ и информационные технологии "САИТ-2013"». Институт вычислительного моделирования СО РАН, 2013. С. 200-207.