Интеллектуальный анализ текстов на основе методов разноуровневой обработки естественного языка

Authors

Smirnoff I.

Annotation

Тексты на естественном языке остаются одним из основных способов хранения и передачи информации, при этом объёмы текстовых данных неуклонно растут. Для получения полезной информации из текстов применяются методы информационного поиска и интеллектуального анализа текстов, при этом большое значение имеют применяемые подходы к обработке и представлению текстов, влияющие на качество и интерпретируемость получаемых результатов. Несмотря на широкое использование больших языковых моделей, сегодня потенциал подходов к обработке текстов на основе лингвистических признаков ещё не исчерпан. Доклад посвящен проблеме извлечения из текста структур, соответствующих уровням языка – синтаксису, семантике, дискурсу. В докладе будут представлены методы семантического и дискурсивного анализа текстов на русском языке, проанализирована эффективность применения разноуровневых структур в информационном и вопросно-ответном поиске, извлечении информации из текстов, разрешении кореференции, анализе аргументации и психолингвистике. Будет дана оценка перспективности лингвистических подходов к обработке текстов в контексте развития больших языковых моделей.

External links

Watch the presentation at the official channel (in Russian):

Reference link

Смирнов И. В. Интеллектуальный анализ текстов на основе методов разноуровневой обработки естественного языка // Совместный семинар РАИИ и ФИЦ ИУ РАН «Проблемы искусственного интеллекта» (Москва, 2 октября 2024 г.).