Александр Панов, Константин Яковлев и Алексей Скрынник пусть имитационно, но обучили MAPF-GPT на AAAI 2025

06.03.2025

 

«Каждый год в конце февраля мы с друзьями летаем на AAAI»... Так Александр Панов мог бы начать свой рассказ об очередном фуроре, вызванном его выступлением на одном из крупнейших международных форумов в области ИИ. К сожалению, в этом году Александр и объединённая им команда Института проблем искусственного интеллекта ФИЦ ИУ РАН, МФТИ и AIRI в лице Антона Андрейчука, Константина Яковлева и Алексея Скрынника не поехали в солнечную Филадельфию, где с 25 февраля по 4 марта проходила 39-я конференция по искусственному интеллекту AAAI 2025. Что, однако, не помешало их замечательным коллегам из Японии представить доклад, а также всех авторов поимённо.

 

О «MAPF-GPT: имитационном обучении в масштабе многоагентного планирования» (ссылка) накануне писали все кому не лень. Мы же писали о нём ещё осенью: это первая в мире базовая модель для задачи мультиагентного поиска пути (MAPF), которая позволяет принимать решения о действиях агентов непосредственно в процессе выполнения задачи. «Экспертный датасет → умная токенизация → трансформер → и вуаля → SOTA результат в задаче MAPF относительно других обучаемых методов», — вот как вкратце описывает её функционал сам Александр.

Архитектура анализирует наблюдения и затем просчитывает оптимальные решения, прогнозируя их последствия и корректируя действия в реальном времени для динамичных сценариев. В ходе работы исследователи также подготовили беспрецедентно огромный датасет для мультиагентного принятия решений объёмом в 1 миллиард пар «наблюдение-действие». Обработка данных ведётся в формате последовательностей фиксированного размера в 256 токенов, в которых закодирована информация о текущем состоянии среды и действиях всех участников системы.

Всё это позволяет агенту мгновенно реагировать на новые объекты, повороты или проходящего мимо зеваку. Кстати, именно в подобных ситуациях проявляется вся мощь системы: она моментально перекраивает маршрут, чтобы предотвратить потенциальные столкновения и аварии. Её механизм внимания обучен выделять значимую информацию и учитывать поведение других агентов, повышая точность решений. В будущем MAPF-GPT будет применяться и в задачах многоагентного обучения с подкреплением (MARL) на аналогичной SMAC среде, основанной на видеоигре StarCraft II.

Отличная стратегия, если кто не играл. Стратегия же 71 отдела, как всегда, беспроигрышна: брать штурмом все мировые события по ИИ-тематике, не взирая на препятствия. Ну вот, взяли очередной AAAI. От всей души поздравляем коллег!

Cсылки по теме:

сайт AAAI 2025