Номер патента: RU 2823436 C1
eLibrary: https://www.elibrary.ru/item.asp?id=68602539
Дата регистрации: 21.12.2023
Дата публикации: 23.07.2024
Патентообладатели: Федеральное государственное бюджетное учреждение науки Институт системного программирования им. В.П. Иванникова Российской академии наук
Изобретение относится к области искусственного интеллекта. Технический результат заключается в обеспечении высокой точности, полноты и уровня достоверности результатов автоматической рубрикации. Система автоматического определения тематики текстовых документов на основе объяснимых методов искусственного интеллекта содержит совокупность взаимосвязанных друг с другом модулей, взаимодействующих путём обмена синхронизирующими сигналами через входы и выходы. В качестве модулей применены: модуль предварительной обработки входных данных, модуль лингвистического анализа, модуль оценки значимости слов и словосочетаний, модуль определения тематики, содержащий представление иерархии рубрик, модуль объяснения результата рубрикации, который, получив результаты отнесения классифицируемого документа к некоторому подмножеству рубрик, а также значимые признаки текста, формирует объяснение в форме строковых представлений слов и словосочетаний и их значимости, модуль управления процессом обучения, который реализует этапы процесса обучения системы, модуль управления процессом рубрикации, который реализует этапы процесса определения соответствия тематики текста поступающих документов категориям рубрикатора. 3 з.п. ф-лы, 3 ил.