В докладе будут рассмотрены различные формальные постановки задачи обучения с подкреплением: без модели и с моделью среды, многоагентная и объектно-центричная. Будут представлены теоретические основы, лежащие в основе базовых алгоритмов обучения с подкреплением, и проанализированы ключевые алгоритмические особенности основных подходов. Особое внимание будет уделено обучению с моделью мира и различным вариантам интеграции методов планирования в процесс обучения. В заключение рассматриваются несколько примеров решения задач с помощью методов, разрабатываемых под руководством автора доклада, в том числе из области робототехники.
Смотреть презентацию на канале семинара:
Панов, А. И. Обучение с подкреплением: теоретические основы и алгоритмические реализации // Совместный семинар РАИИ и ФИЦ ИУ РАН «Проблемы искусственного интеллекта» (Москва, 30 октября 2024 г.).