Полнотекстовый классификатор патентных документов

Авторы

Ядринцев В. В. Соченков И. В.

Аннотация

В настоящей статье рассматривается задача классификации патентных документов на основе расширенного именными подгруппами векторного представления полнотекстовых документов. Процесс классификации начинается с извлечения ключевых слов и словосочетаний из документа с помощью автоматической обработки текста, затем выявляются значимые ключевые слова и словосочетания на основе статистической меры, далее оценивается тематическая близость документов на основе векторов с ключевыми словами и словосочетаниями. В настоящей работе в качестве набора классов используются три самых низких уровня международной патентной классификации.

Внешние ссылки

Скачать PDF сборника тезисов конференции в библиотеке eLibrary (англ., требуетя регистрация): https://elibrary.ru/item.asp?id=35359532

Ссылка при цитировании

Ядринцев В. В., Соченков И. В. Full Text Patent Classification // Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем: Материалы VIII Всероссийской конференции с международным участием (Москва, 16–20 апреля 2018). – М.: РУДН, 2018. С. 235–237.