Following gesture control of UAV Mikhail Khachumov went down into the waters under conditions of uncertainty

11.06.2024

 

Мы как-то привыкли к тому, что 75-й отдел Института проблем искусственного интеллекта обычно приподнимает нас над земной твердью благодаря ведущим исследованиям в области пилотирования БПЛА. Однако в своей новой статье для «Морских интеллектуальных технологий» (название журнала уже должно насторожить) Михаил Хачумов и Владимир Мелехин кардинально сменили стихию. «Автоматическое построение элементов представления процедурных знаний подводным интеллектуальным роботом в условиях недоопределённости» (ссылка) предлагает новый подход к построению решателей сложных практических задач в проблемных средах при погружении аппаратов в морские пучины.

 

Он зиждется на идее автоматического синтеза фрейм-микропрограммы поведения (ФМП) первого и второго типов. Cуществующие модели, основанные на применении логики предикатов первого порядка, не позволяют подводным интеллектуальным роботам (ИР) адаптироваться к недоопределённым условиям функционирования. Это чревато экспоненциальной сложностью вывода решений и трудностями при выработке практических миссий в мутных водах. Предложенная выше структура разбивает микропрограммы на типовые модули и использует их

а) как самостоятельные элементы модели представления процедурных знаний ИР;

б) как элементы для автоматического синтеза ФМП при выводе решений сложных задач и подзадач.

Полученные в результате декомпозиции модули определяют относительно простые навыки поведения автономных подводных аппаратов. Они помогают сделать процесс планирования целенаправленной деятельности более гибким либо автоматически построить недостающие типовые элементы представления процедурных знаний — выбор зависит от замысловатости задания и от размерности семантической сети, описывающей текущую ситуацию. Дальше, как говорится, дело техники.


 

Минутка рекламы: техника и учёные предоставлены проектом по созданию моделей и методов интеллектуально-геометрического управления (ссылка) под руководством Михаила Хачумова при поддержке гранта РФФИ № 21-71-10056. Благодаря ему же свет увидел и более традиционный для ФИЦ ИУ РАН и Лаборатории интеллектуального управления ИПС им. А. К. Айламазяна манускрипт «Жестовое управление полётом малого беспилотного летательного аппарата» (ссылка). Рассказ об инструментальных средствах распознавания образов и оценке эффективности управления БПЛА опубликован во втором выпуске «Программных систем: теория и приложения».

 

 

Авторы пробежались по ранним разработкам в данной области и выложили собственную инструкцию для квадрокоптера модели DJI Phantom 3 Standard Edition, оснащённой многофункциональной двухповоротной видеокамерой. Камера фиксирует условленные жесты и преобразует их в команды управления беспилотником — «взлёт», «приземление», «перемещение», «домой», «поворот», «остановка» — благодаря мультимодальному интерфейсу с интеллектуальным решателем. А для их идентификации предусмотрен классификатор на основе свёрточных искусственных нейронных сетей (ИНС) из библиотеки по локализации целевых объектов Ultralytics. Они позволяют выделять целевые объекты в кадре в режиме реального времени.

 

Команды управления поступают на смартфон в программу на базе симулятора полётов DJI SDK, которая посылает их по радиоканалу дистанционного управления. Ряд экспериментов со всеми шестью архитектурами ИНС для ориентированных и неориентированных прямоугольников не только помогли выделить основные показатели качества, но и продемонстрировали достаточную для практического использования точность распознавания жестовых команд, не уступающую зарубежным аналогам. Кроме того, исследователи составили краткий сценарий обращения с БПЛА из девяти пунктов, незаменимый для операторов. Просто распечатать — и на стенку.


В заключение не можем обойти стороной и ещё один труд Михаила, напечатанный в 4-м выпуске «Научно-технического вестника Поволжья»: «Концепция построения программной библиотеки для поддержки врача-исследователя на основе анализа данных МРТ» (ссылка). Однако обойдёмся без подробностей, поскольку текст полностью соответствует докладу Анны Пиняевой на апрельской конференции ITTMM 2024 — о ней мы, соответственно, писали в апреле. Тем более, что по ссылке вас ждёт живое выступление Анны!


Cсылки по теме:

сайт издательства «МОРИНТЕХ»

сайт журнала «Программные системы: теория и приложения»

сайт журнала «Научно-технический вестник Поволжья»