Формат A4: А. Корчемный о распутанных представлениях, А. Чуганская о знаковых представлениях изображений, А. Староверов о представлении семантической карты, А. Панов о роботах-гуманоидах

Представьте, сколько сразу новостей от команды Александра Панова, посвящённых представлениям! Кроме новости от самого Александра, точнее, комментария «Российской газете» для статьи «Что уже сегодня умеют роботы-гуманоиды» (ссылка). Что же они умеют? По его словам, немногое, поскольку зависят не от оболочки, а от влияния искусственного интеллекта на развитие когнитивных возможностей. Современные системы управления не могут обеспечить полную адаптивность к окружающей среде, а значит, только «когда и если появится AGI, то есть сильный ИИ, можно будет говорить о том, что машины как минимум не уступают людям», — резюмировал он. И добавил, что замена людей начнётся в сфере прикладных задач, не требующих специальной подготовки. Где она закончится, эксперт не уточнил.

А чуть ранее в специальном выпуске Logic Journal of the IGPL издательства Oxford University Press Анфиса Чуганская, Алексей Ковалёв и Александр Панов рассказали о «критерии знаковых представлений изображений для визуальных ответов на вопросы социального взаимодействия» (ссылка), основанном на психологическом исследовании. В отличие от большинства современных датасетов VQA для тренировки систем машинного обучения с вопросами, ответы на которые ограничены прямым доступом к изображению либо обращением к внешним данным, авторы учитывали особенности социальных отношений между людьми. Тем самым они продолжили тему, начатую в докладе «Применяя векторную символическую архитектуру и семиотический подход к визуальному диалогу» (ссылка) для конференции HAIS 2021.

Ещё одна англоязычная публикация «Представление интерактивной семантической карты для skill-based визуальной объектной навигации» (ссылка) объединённой команды ФИЦ ИУ РАН и МФТИ в лице Татьяны Земсковой, Алексея Староверова, Кирилла Муравьёва, Дмитрия Юдина и Александра Панова вышла в популярном журнале IEEE Access. Речь в ней идёт о новом представлении сцены, сформированном семантической картой в ходе взаимодействия воплощённых агентов с окружающей средой и внедрённом в новейший навигационный подход SkillTron по мотивам фреймворка SkillFusion (ссылка). SkillTron способен подбирать умения роботов из end-to-end элементов на основе обучения с подкреплением и классических методов планирования на карте. Благодаря ему можно устанавливать как промежуточные, так и конечные цели для объектной навигации.

Наконец, поздним вечером 8 апреля на вебинаре по векторным символическим архитектурам и гиперразмерным вычислениям VSAONLINE, которые регулярно организует наш друг Евгений Осипов, с презентацией «Символические распутанные представления для изображений» (ссылка) выступили Александр Корчемный и Алексей Ковалёв. Точнее, Алексей лишь ввёл в курс дела, сама презентация легла на плечи Александра. Целый час он на английском объяснял слушателям структуру алгоритма ArSyD (Architecture for Symbolic Disentanglement), где каждый генеративный фактор представлен вектором того же измерения в качестве представления, ведущего к результату, его задачи, обучение и получение представления VSA-объекта из изображения, метрику реконструкции, датасеты dSprites и CLEVR, ну и полученные в ходе испытаний результаты. Под конец уже чувствовалась усталость докладчика, но он с честью вынес это испытание. Смотрите запись на канале Евгения: