В докладе будет рассмотрена проблема обобщения и переобучения в обучении с подкреплением (RL). Рассмотрим различные типы определения обобщенной стратегии и подходы к повышению генерализующей способности методов RL. Уделим особое внимание одному из таких подходов — использование отдельных блоков памяти и применение современных трансформерных архитектур. Рассмотрим последние алгоритмы и методы, работающие как в онлайн, так и в оффлайн режиме.
Read the presentation at the research page: https://rairi.frccsc.ru/en/products/13
Watch presentation at the Center for Cognitive Modeling channel (from 1:03:53):
Aleksandr Panov. Generalization, memory and transformative models in reinforcement learning // XXIV International Conference "Neuroinformatics-2022". Moscow: MEPhI, 2022.