В исследовании поднимается тема асинхронной природы современных групповых чатов и связанных этим проблем, таких как получение соответствующей информации и понимание того, кто кому отвечает. В этой работе мы формализуем задачу восстановления ответов как базовый блок в решении описанных проблем. Используя простые эвристики, мы стараемся применить полученную модель восстановления ответа к проблеме реконструкции тредов сообщений. В результате мы показали, что современные предварительно обученные модели, такие как BERT, показывают отличные результаты на задаче восстановления ответов по сравнению с более простыми моделями. Тем не менее тесты показали, что использование модели с простыми эвристиками не дают хороших результатов на задаче реконструкции тредов. Кроме того, эксперименты показали, что производительность модели зависит от домена чата. Мы опубликовали модель и набор данных на русском языке, который мы создали из чатов Telegram из разными доменов, для задачи восстановления ответов. Мы также опубликовали тестовый набор для задачи реконструкции тредов.
DOI: 10.28995/2075-7182-2023-22-1052-1060
Скачать PDF статьи на сайте «Диалог 2023» (англ.): https://www.dialog-21.ru/media/5871/buyanoviplusetal046.pdf
Скачать PDF сборника конференции (дополнительный том) на сайте «Диалог 2023» (англ.): https://www.dialog-21.ru/media/6033/dialog2023rinzlr.pdf
Скачать PDF статьи из библиотеки eLibrary (англ., требуется регистрация): https://elibrary.ru/item.asp?id=54231177
Игорь Буянов, Дарья Яськова, Илья Соченков. Кто кому отвечает? Моделирование взаимоотношений сообщений в асинхронных чатах на русском языке // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной международной конференции «Диалог». Вып. 22. 2023. C. 1052-1060.