Дмитрий Девяткин возглавил молодёжную лабораторию кросс-языкового анализа текстов ФИЦ ИУ РАН и поведал об аффективно-оценочном компоненте аттитюда на конференции УГИ УрФУ

Руководитель 73 отдела Института проблем искусственного интеллекта Дмитрий Девяткин всерьёз занялся омоложением науки. После дебюта на Конгрессе молодых учёных и участия в крупной разработке Почвенного института, где более половины специалистов на заключительном этапе не переступили 40-летний порог, он решил возглавить собственную молодёжную лабораторию! Заявка на её создание, поданная ФИЦ ИУ РАН в прошлом году в рамках национального проекта «Наука и университеты», прошла одобрение. Основное условие — не менее 2/3 лаборантов в возрасте до 39 лет — коллектив не смущает. Но, разумеется, внимание Минобрнауки привлёк не столько возраст Дмитрия и его команды, сколько их внушительный опыт, а также ИИ в качестве одного из актуальных направлений.

Тема исследований заявлена как «Развитие методов, моделей и технологий кросс-языкового анализа и контролируемого синтеза текстов для создания информационных сервисов поддержки профессиональной деятельности». По правилам гранта, «ключевые результаты деятельности лабораторий должны иметь быстрый переход в практическое применение, а также включать опытные образцы, прототипы изделий с определёнными характеристиками, материалы с заданными свойствами». В нашем случае формирование фундаментальных и прикладных заделов для создания цифровых платформ в высокотехнологичных областях уже имеет прототип в виде «ИИ-помощника учёного», который мы анонсировали в феврале. Есть, от чего отталкиваться и к чему стремиться. А уж организаторы обещают обеспечить перспективных сотрудников всем необходимым, включая современную приборную базу и достойную заработную плату. Дорогу молодым!

Впрочем, старших товарищей Дмитрий тоже не забывает. К 11 апреля он вместе с Натальей Чудовой и Владимиром Салимовским подготовил междисциплинарную работу «Выявление показателей оценочного компонента аттитюда на основе внутренних векторных представлений сети BERT» (ссылка) для международной научной конференции «Аксиологические аспекты современных филологических исследований» — её Уральский гуманитарный институт УрФУ и журнал Quaestio Rossica проводят уже в десятый раз. Доклад стал продолжением прошлогоднего труда, посвящённого фрустрациям в постах пользователей, и вынес на обсуждение задачу автоматического анализа социальных сетей с помощью идентификации высказываний, реализующих аффектно-оценочный компонент социальной установки.

В своей презентации авторы подтвердили выдвинутый ранее тезис о том, что при дообучении большой языковой модели (БЯМ) обучающую выборку целесообразно создавать на материале текстовых сегментов, представляющих искомую системность речи, а её взаимосвязанные элементы формируют признаковое пространство, которое позволяет успешно решать классификационную задачу. Предварительное обучение БЯМ на представительных корпусах текстов с миллиардами словоупотреблений позволяет относительно полно моделировать систему языка, тогда как дообучение на сравнительно небольших коллекциях обеспечивает её перестройку в речевую систему. Эксперименты показали, что высказывания надёжно идентифицируются, а проявления речевой системности — распознаются на основе внутреннего состояния БЯМ.

Cсылки по теме:

новость на сайте Минобрнауки

новость в группе ФИЦ ИУ РАН

сайт конференции УрФУ