Система автоматического определения тематики текстовых документов на основе объяснимых методов искусственного интеллекта

Патент

Номер патента: RU 2823436 C1

eLibrary: https://www.elibrary.ru/item.asp?id=68602539

Дата регистрации: 21.12.2023

Дата публикации: 23.07.2024

Патентообладатели: Федеральное государственное бюджетное учреждение науки Институт системного программирования им. В.П. Иванникова Российской академии наук

Аннотация

Изобретение относится к области искусственного интеллекта. Технический результат заключается в обеспечении высокой точности, полноты и уровня достоверности результатов автоматической рубрикации. Система автоматического определения тематики текстовых документов на основе объяснимых методов искусственного интеллекта содержит совокупность взаимосвязанных друг с другом модулей, взаимодействующих путём обмена синхронизирующими сигналами через входы и выходы. В качестве модулей применены: модуль предварительной обработки входных данных, модуль лингвистического анализа, модуль оценки значимости слов и словосочетаний, модуль определения тематики, содержащий представление иерархии рубрик, модуль объяснения результата рубрикации, который, получив результаты отнесения классифицируемого документа к некоторому подмножеству рубрик, а также значимые признаки текста, формирует объяснение в форме строковых представлений слов и словосочетаний и их значимости, модуль управления процессом обучения, который реализует этапы процесса обучения системы, модуль управления процессом рубрикации, который реализует этапы процесса определения соответствия тематики текста поступающих документов категориям рубрикатора. 3 з.п. ф-лы, 3 ил.