Предложен эффективный метод поиска тематически похожих документов. Показана его применимость для решения задач эксплоративного патентного поиска. Метод позволяет снизить трудоемкость и повысить качество решения аналитических задач, связанных с патентным поиском и анализом. В качестве признаков для представления текстовых документов используются как отдельные лексемы, так и словосочетания, выделяемые синтаксически. Это позволяет решить проблему экспоненциального роста размерности признакового пространства и дает возможность эффективной индексации больших массивов текстовой информации. Представлены результаты экспериментов по решению одной из задач экспертизы заявок на изобретения и полезные модели. Сделаны выводы о перспективности использования метода при решении других задач.
DOI: https://doi.org/10.14357/19922264180111
Статья в журнале «Информатика и её применения» на сайте ИПИ РАН (PDF): http://www.ipiran.ru/journal/issues/2018_12_01/Vol12_Issue1.pdf
РИНЦ: https://elibrary.ru/item.asp?id=32686792
PDF на Math-Net.Ru: http://mi.mathnet.ru/ia520
Читать на ResearchGate: https://www.researchgate.net/publication/325379039_Exploratory_patent_search
Соченков И. В., Зубарев Д. В., Тихомиров И. А. Эксплоративный патентный поиск. Информатика и её применения. 2018. № 1. С. 89-94.