Методы кросс-языкового поиска тематически похожих нормативно-правовых документов

Авторы

Девяткин Д. А. Соченков И. В. Жебель В. В. Зубарев Д. В.

Аннотация

Необходимость изучения мирового опыта для изменения законодательства и нормотворчества вызывает потребность в инструментах информационного поиска нормативно-правовых документов, написанных на разных языках. Одним из аспектов информационного поиска является выявление тематически похожих документов по заданному эталону. В этом контексте возникает важная задача кросс-языкового поиска, когда пользователь информационной системы задает эталонный документ на одном языке, а поисковая выдача содержит релевантные документы на других языках. В настоящем исследовании рассмотрены различные подходы к решению этой задачи: от использования коллекций-медиаторов до более современных методов, опирающихся на дистрибутивную семантику. В качестве тестовой коллекции была использована электронная библиотека ООН, содержащая как оригиналы документов на английском языке, так и их переводы на русский.

Внешние ссылки

DOI: 10.14357/20718594220203

Ссылка при цитировании

В. В. Жебель, Д. А. Девяткин, Д. В. Зубарев, И. В. Соченков. Методы кросс-языкового поиска тематически похожих нормативно-правовых документов // Искусственный интеллект и принятие решений. – 2022. – № 2. – С. 27-35. – DOI 10.14357/20718594220203.