В докладе будет рассмотрена проблема обобщения и переобучения в обучении с подкреплением (RL). Рассмотрим различные типы определения обобщенной стратегии и подходы к повышению генерализующей способности методов RL. Уделим особое внимание одному из таких подходов — использование отдельных блоков памяти и применение современных трансформерных архитектур. Рассмотрим последние алгоритмы и методы, работающие как в онлайн, так и в оффлайн режиме.
Aleksandr Panov. Generalization, memory and transformative models in reinforcement learning // XXIV International Conference "Neuroinformatics-2022". Moscow: MEPhI, 2022.