Грант РНФ № 16-11-00048 https://www.rscf.ru/project/16-11-00048/ продлён https://www.rscf.ru/project/19-11-11001/
Название: Создание теории, методов и моделей децентрализованного управления поведением коллективов когнитивных робототехнических систем в недетерминированной среде
Руководитель проекта: Осипов Геннадий Семёнович, Яковлев Константин Сергеевич
Организация финансирования: Федеральный исследовательский центр «Информатика и управление» Российской академии наук
Срок выполнения при поддержке РНФ: 2016–2018, продлён на 2019–2020
Проект посвящён решению фундаментальной научной проблемы — созданию и развитию теоретических основ (теории, методов и моделей) управления поведением коллективов робототехнических систем, функционирующих в условиях недетерминированной среды.
Актуальность решения фундаментальной научной проблемы определяется с одной стороны — стремительным ростом во всём мире числа робототехнических систем различного типа (наземных, летательных, надводных и подводных) и назначения (спасательных, охранных, логистических и др.), с другой — низкой степенью автономности таких систем. До сих пор в большинстве случаев на практике управление отдельными мобильными роботами и их коллективами по большей части осуществляется операторами. Для повышения степени автономности современных робототехнических систем требуется решения ряда важнейших фундаментальных задач интеллектуального анализа данных и управления, основанного на знаниях, которым и посвящён проект. Среди таких задач:
1) автоматическое картирование наблюдаемых территорий и определение ориентации и местоположения (локализация) по видеопотоку, в том числе, полученному с одиночной видеокамеры, являющейся в большинстве малых беспилотных аппаратов единственным средством технического зрения и источником актуальной информации об окружающей среде;
2) построение моделей представления знаний для наполнения интеллектуальных решателей информацией, достаточной для решения коллективом когнитивных робототехнических систем сложных задач целенаправленного поведения в условиях недетерминированной среды;
3) планирование совокупности неконфликтных траекторий для группы интеллектуальных агентов с учётом действий произвольной продолжительности и возможности перемещения агентов в произвольном направлении;
4) автоматическое формирование программ целенаправленной децентрализованной коллективной деятельности робототехнических систем в условиях недетерминированной среды, для решения конкретных прикладных задач формирования строя, преследования и сопровождения целей и других актуальных целевых задач в условиях наличия рисков нарушения строя и столкновений.
Перечисленные фундаментальные задачи в настоящее время либо не решены, либо нуждаются в существенном совершенствовании методов их решения для достижения приемлемого качества управления робототехническими системами, что обуславливает необходимость выполнения предлагаемой научно-исследовательской работы.
Тематики проекта соответствует основным положениям Стратегии научно-технологического развития Российской Федерации, утверждённой Указом Президента РФ от 01.12.2016 г. № 642, в части перехода к передовым цифровым, интеллектуальным технологиям, роботизированным системам; к созданию систем обработки больших объёмов данных, машинного обучения и искусственного интеллекта; направленным на обеспечение способности страны эффективно отвечать на большие вызовы.
Научная новизна проекта заключается в предлагаемом комплексе методов, подходов и алгоритмов, направленных на обеспечение автономного функционирования коллективов роботизированных систем в условиях неопределенности с учетом рационального взаимодействия различных уровней группового поведения.
Встраивание баз знаний, продукционных правил, методов планирования неконфликтных траекторий и алгоритмов адаптации в робототехнические системы позволит создать эффективную по точности и быстродействию технологию управления робототехническими системами реального времени с максимальным уровнем надёжности и устойчивости по отношению к изменяющимся параметрам объекта и среды, расширить область применения теории в условиях недетерминированности исходной информации. Ожидается получение новых методов автономной навигации и управления робототехническими системами в условиях ограниченных сенсорных (одиночная видеокамера), вычислительных (малые ресурсы бортовых комплексов) и коммуникационных ресурсов (отсутствие GPS/ Glonass навигации). Все предлагаемые решения (модели, подходы, методы и алгоритмы) обладают необходимой степенью новизны, выявленной по результатам анализа российских и зарубежных публикаций. Ожидаемые результаты, в целом, соответствуют мировому уровню развития теории интеллектуального управления, а их практическое применение позволит обеспечить построение автономных робототехнических систем широкого назначения.
Предложен новый способ описания представления участника коалиции о внешней среде, о своем опыте и умениях других участников коалиции, основывающийся на совмещении процедурного и декларативного знания об объекте или процессе. В этих целях была использована теория знаковой картины мира, была введена специальная структура, описывающая компоненты знака — каузальная матрица и исследовано строение специальных типов семантических сетей — каузальных сетей на компонентах знака. На основе введенных понятий была предложена схема коммуникативного взаимодействия агентов с целью согласования одной из компонент знака — значения, представляющего обобщенные знания в картине мира.
Предложен оригинальный метод идентификации блокирующих препятствий, расширяющий базовый возможности стандартных алгоритмов планирования траектории. Метод может применяться в составе интеллектуальной системы управления для передачи информации о причинах невозможности построения траектории в заданную область на более высокие уровни управления, в частности — модулям планирования поведения. Далее эта информация может быть использована для планирования воздействия на окружающую среду, в результате которого цель может стать достижимой. Таким образом, становится возможным решать задачи, принципиально не разрешимые в традиционной парадигме планирования траектории, когда возможна лишь констатация факта о невозможности построить траекторию без указания причин. Проведено экспериментальное исследование предложенного метода. Установлено, что последний характеризуется достаточной степенью вычислительной эффективности для применения на практике при решении задач навигации беспилотных летательных аппаратов в городских условиях.
Даны постановки двух базовых задач преследования цели группой летательных аппаратов на плоскости, имеющих прикладное значение. Предложена схема работы интеллектуальной системы управления ЛА, позволяющей решать задачи преследования цели с учетом ветровой нагрузки. Решение основано на использовании математической модели ЛА, геометрических методов и стратегий поведения, реализуемых правилами выбора углов ориентации и скоростей полета. Для решения задачи преследования цели на плоскости разработаны стратегии поведения игроков, использующие методы прогнозирования их траекторий движения и координат точек встреч. Предложен набор правил, которые предоставляют широкие возможности для интеллектуального управления группой ЛА. Разработан алгоритм поиска замкнутых областей, образуемых пересекающимися окружностями Аполлония, что позволяет участникам оценивать текущую ситуацию. Разработана общая схема моделирования процесса преследования цели в системе MATLAB Simulink, использующая структурные схемы автоматического управления ЛА, построенные на основе передаточных функций звеньев. Проведенные экспериментальные исследования показали, что предложенные стратегии и реализующие их правила позволяют получить приемлемое по точности решение задачи преследования цели в условиях дефицита времени и необходимости оперативных действий, вызванных отклонениями при ветровых воздействиях.
В работе предложен метод построения композитных вычислительно эффективных нелинейных алгоритмов стабилизирующего управления для нелинейных систем с формальным выделением двух групп движений («быстрых» и «медленных»). Метод основан на декомпозиции исходной системы на две подсистемы меньшей размерности и на определении стабилизирующих регуляторов этих подсистем. Объединение полученных регуляторов определяет итоговое композитное управление. Используемая техника базируется на приближенном решении уравнения Риккати с коэффициентами, зависящими от состояния. Получены численно-аналитические формы для синтеза регулятора и условия локальной асимптотической устойчивости в соответствующих замкнутых системах. Численное моделирование показывает не только работоспособность и эффективность предложенного подхода, но и демонстрирует отказоустойчивость построенных регуляторов, несмотря на потерю управляемости в одной из подсистем, ослабление связности подсистем или в условиях ограниченных нестационарных возмущений в коэффициентах подсистем.
1. Андрейчук А. А., Яковлев К. С. Методы идентификации блокирующего препятствия в задачах планирования траектории // Информатика, управление и системный анализ: Труды IV Всероссийской научной конференции молодых учёных с международным участием, Т. I, стр. 96-105 (год публикации — 2016).
2. Даник Ю. Э. LMI-based robustness analysis of the nonlinear regulator for discrete time nonlinear systems // Fullpapers E-Book 6th. world Congress on Electrical Engineering, Computer Science and Information Technology (WCECIT 2016), Pp. 96-101 (год публикации — 2016).
3. Даник Ю. Э. About the robustness of the middle stabilizing controller for quasi-linear state dependent coefficients discrete-time systems // 3rd International Conference on Analysis and Applied Mathematics (ICAAM), Almaty, KAZAKHSTAN, Vol. 1759, e020013 (год публикации — 2016).
4. Панов А. И., Яковлев К. С. Psychologically Inspired Planning Method for Smart Relocation Task // Procedia Computer Science, Vol. 88, p. 115-124 (год публикации — 2016).
5. Хачумов М. В. The problem of target pursuit by a group of unmanned flight vehicles // 2016 International Siberian Conference on Control and Communications (SIBCON), p. 1-4 (год публикации — 2016).
6. Хачумов М. В. Задачи группового преследования цели в условиях возмущений // Искусственный интеллект и принятие решений, № 2, с. 46-54 (год публикации — 2016).
В ходе выполнения работ по проекту были разработаны новые методы и алгоритмы формирования компонент знаковой картины мира когнитивным агентом в условиях коалиционного взаимодействия. В качестве базового процесса, на примере которого исследовалось взаимодействие агентов в группе был рассмотрен вариант совместного составления группового плана, который включает в себя образование новых компонент знака и разработанный на предыдущем этапе протокол коммуникации для согласования знаний (планов). На текущем этапе выполнения проекта был разработан оригинальный метод (гетерархическая каузальная сеть — ГКС) формирования образной компоненты знака (каузальной матрицы), в основе которого лежат нейрофизиологические соображения по работе некоторых отделов коры головного мозга человека. Для использования ГКС в задаче формирования каузальных матриц (образной компоненты) с использованием обучения с подкреплением была внесена модификация, позволяющая учитывать вознаграждение от среды в работе временного группировщика. Разработанный на первом этапе проекта формализм каузальных матриц был использован при создании итеративного алгоритма связывания образа и значения знака — доопределения функции связывания образа и значения. В ходе работ по проекту был разработан алгоритм коалиционного планирования multiMAP, который состоит из четырёх основных этапов: этап означивания, этап индивидуального планирования, этап согласования планов и этап сохранения опыта. В рамках демонстрации особенностей применения знакового подхода к решению задачи распределения ролей, сохранения опыта и согласование знаний (планов) были проведены экспериментальные исследования, в которых рассмотрены решение задач планирования «Мир блоков» и «Логистика».
На тактическом уровне управления исследовалась задача планирования совокупности траекторий для коалиции агентов, обладающих возможностью модификации окружающей среды за счет целенаправленных действий участников коалиции. Предложен новый метод решения этой задачи, который основан на оригинальном подходе к идентификации препятствий, оказывающих наибольшее влияние на ход решения задачи планирования, и последующем удалении этих препятствий за счет целенаправленных действий одного (или нескольких) участников коалиции. В результате такой модификации пространства становится возможным отыскание траекторий для индивидуальных агентов, которые превосходят первоначальные по заданным параметрам качества (например — длине). Метод может применяться в составе интеллектуальной системы управления коалицией робототехнических систем, действующих в общем пространстве (workspace). Проведено экспериментальное исследование предложенного метода, в ходе которого установлено что его применение способствует повышению качества и эффективности решения поставленной задачи.
На тактическом уровне, кроме того, были даны постановки задач преследования и «захвата» динамической цели группой летательных аппаратов в пространстве в условиях возмущенной воздушной среды. Предложена схема интеллектуальной системы управления автономным летательным аппаратом в процессе преследования цели, в которой учтены математические модели объекта управления и ветровых возмущений. Предложен геометрический метод прогнозирования точки встречи преследователя и убегающего в пространстве, который является составной частью метода параллельного сближения. Разработан подход к оценке ситуации и планированию поведения игроков, основанному на вычислении и анализе расположения сфер Аполлония. Предложен подход к определению замкнутых областей, ограниченных пересекающимися сферами, которые препятствуют движению цели. Предложен расширенный набор правил управления, которые имитируют действия пилота. Предложена общая схема моделирования процесса преследования цели для нескольких преследователей и одного убегающего, учитывающая математические модели летательного аппарата и ветровой нагрузки, представленные в виде передаточных функций. Проведены экспериментальные исследования, которые показали, что заложенные в систему управления стратегии и реализующие их правила успешно справляются с задачами преследования-убегания и задают естественное поведение объектов в пространстве.
На реактивном уровне управления был разработан метод построения композитного отказоустойчивого нелинейного алгоритма управления. В отличие от результатов прошлого года предложенное управление содержит более полную и нестационарную нелинейную коррекцию, которая позволяет улучшить свойства эффективности в плане рассматриваемого критерия. Была сформулирована соответствующая теорема об условиях применимости метода и об оценках близости предложенного управления к тому, которое получается с помощью известного SDRE метода. В отличие от последнего, при синтезе разработанного регулятора используются также аналитические представления, что существенно снижает вычислительную сложность алгоритма. Проведенные численные эксперименты продемонстрировали эффективность полученного управления по введённому критерию и хорошую отказоустойчивость по сравнению с линейным композитным управлением.
Исследован аналог представленного регулятора для дискретных несингулярных систем. Для получения сравнительной характеристики построено еще четыре альтернативных управления на основе решения дискретного уравнения Риккати, с зависящими от состояния коэффициентами. Результаты экспериментов показывают, что предлагаемый нелинейный регулятор обеспечивает лучшую производительность по сравнению с линейным методом и является более простым в вычислительном плане, чем другие обсуждаемые подходы. Было показано, что построенное приближение может быть успешно использовано для управления нелинейными дискретными системами в тех случаях, когда нужно избежать вычислительно затратных операций на каждом шаге алгоритма управления. Пример с наличием неопределенного параметра в модели демонстрирует некоторую отказоустойчивость предлагаемого регулятора.
1. Андрейчук А. А., Яковлев К. С. Applying MAPP algorithm for cooperative path finding in urban environments // Lecture Notes in Computer Science, Volume 10459, Pages 1-10 (год публикации — 2017).
2. Даник Ю. Е., Дмитриев М. Г. A comparison of numerical algorithms for discretetime state dependent coefficients control systems // 21st International Conference on System Theory, Control and Computing (ICSTCC), pp. 401-406 (год публикации — 2017).
3. Дмитриев М. Г., Макаров Д. А. The stabilizing composite control in a weakly nonlinear singularly perturbed control system // 21st International Conference on System Theory, Control and Computing (ICSTCC), pp.589-594 (год публикации — 2017).
4. Киселев Г. А., Панов А. И. Synthesis of the Behavior Plan for Group of Robots with Sign Based World Model // Lecture Notes in Computer Science, vol. 10459, pp. 83-94 (год публикации — 2017).
5. Панов А. И., Яковлев К. С., Суворов Р. Grid Path Planning with Deep Reinforcement Learning: Preliminary Results // Procedia Computer Science (год публикации — 2017).
6. Хачумов М. В. Controlling the motion of a group of unmanned flight vehicles in a perturbed environment based on the rules // 2017 International Siberian Conference on Control and Communications (SIBCON) (год публикации — 2017).
7. Хачумов М. В. Решение задачи группового преследования цели в условиях возмущений (пространственный случай) // Искусственный интеллект и принятие решений, №2, c. 31-41 (год публикации — 2017).
8. Хачумов М. В., Хачумов В. М. The problem of target capturing by a group of unmanned flight vehicles under wind disturbances // 2nd Russian-Pacific Conference on Computer Technology and Applications (RPC 2017). Proceedings (год публикации — 2017).
9. Яковлев К. С., Андрейчук А. А. Any-Angle Pathfinding for Multiple Agents Based on SIPP Algorithm // Proceedings of the 27th International Conference on Automated Planning and Scheduling (ICAPS 2017), 586-593 (год публикации — 2017).
10. Хачумов М. В. Задача преследования цели группой беспилотных летательных аппаратов в возмущенной среде // Материалы XX Юбилейной Международной конференции по вычислительной механике и современным прикладным программным системам (ВМСППС-2017), 24-31 мая 2017 г., Алушта, с. 714-716 (год публикации — 2017).
За отчётный период были завершены развитие и разработка базового алгоритма для управления поведением агента со знаковой картиной мира — алгоритм MAP. Была уточнена иерархическая структура этапов планирования, введены процедура абстрагирования и уточнения, которые позволяют переходить с одного уровня абстракции на другой, ускоряя работу процедуры планирования или учитывая новую информацию, поступающую из недетерминированной среды. Был добавлен этап отслеживания выполнения плана, который позволяет реализовать в будущем блок перепланирования на стратегическом уровне. Алгоритм MAP был оснащён дополнительными этапами согласования построенных индивидуальных планов, что в итоге приводит к распределению ролей, и целеполагания в сценарном и эмпирических случаях. Процесс согласования планов агентами коалиции происходит в три шага: первым является шаг выбора плана каждым из агентов, в результате у агента остаётся только один план из множества всех доступных планов, за который он будет голосовать. Далее следует шаг выбора способа коммуникации между агентами и создание сообщения для других агентов, на этом шаге агент преобразует оставшийся план в текстовое сообщение. Последним является шаг проведения аукциона, по итогу которого агенты получают финальный план действий. Аукцион производится на сервере коммуникации агентов, который является централизованной системой связи всех агентов. При исследовании процесса целеполагания было выделено два типа этого процесса: эмпирический и сценарный. Для первого типа характерно использование опыта выполнения действий в схожей ситуации планирования, а для второго — использование известных сценариев достижения цели, хранящихся на сети значений картины мира агента.
В ходе работ также исследовалась задача планирования траектории интеллектуального агента в динамической среде, в частности — при добавлении/удалении препятствий. Предложен новый метод динамического планирования траектории, учитывающий также ограничения на геометрическую форму траектории, — LPLIAN. Этот метод является комбинацией разработанного авторами ранее алгоритма LIAN и подхода постоянного планирования — Lifelong Planning, когда при изменении окружающей среды не осуществляется полное перепланирование, а траектория достраивается с учетом уже имеющихся результатов вычислений (известных с предыдущих итераций планирования). Для успешной реализации такой комбинации предложена процедура поиска предшествующего элемента пространства состояний, которая позволяет осуществлять локальное перепланирование траектории. Метод является универсальным и может применяться для планирования как в динамической, так и в статической среде. Проведено экспериментальное исследование предложенного метода, в ходе которого установлено что его применение способствует повышению вычислительной эффективности решения поставленной задачи.
В ходе работ над проектом были даны постановки и описаны решения двух траекторных задач (следования по маршруту и преследования динамической цели) на плоскости для летательного аппарата, выполняющего полётное задание в неопределенной среде при наличии препятствий. Разработаны и представлены в структурированной форме алгоритмы динамического планирования маршрута летательного аппарата на определенной высоте для решения задач достижения неподвижной и динамической целей. Алгоритмы обеспечивают возможность движения к местоположению цели по локально-оптимальному маршруту в условиях неопределенности. Разработана общая схема моделирования процесса преследования цели летательным аппаратом в системе MATLAB Simulink, которая: учитывает математические модели ветровых нагрузок и движения летательного аппарата; прогнозирует направление движения цели; применяет стратегии и правила, имитирующие действия пилота в условиях ветровых возмущений; реализует динамическое планирование движения ЛА при наличии препятствий. Экспериментальные исследования показали перспективность применения метода динамического планирования маршрута летательного аппарата и разработанных стратегий и правил управления для решения траекторных задач в априори неописанной среде.
В ходе работ по задачам непосредственного управления была осуществлена постановка задачи стабилизации гибкого робота-манипулятора с одним звеном. Из-за возникающих вследствие гибкости соединения колебаний управление таким манипулятором является достаточно сложной и актуальной проблемой. Модель робота является нелинейной и сингулярно возмущенной. Осуществлена разработка двух композитных регуляторов: линейного и нелинейного. Первый является широко распространенным для сингулярно возмущенный систем. Метод построения второго регулятора был разработан в ходе работ по проекту. В ходе численных экспериментов рассмотрены 7 сценариев: один без отказов и 6 сценариев с существенным изменением параметров модели управления. Во всех рассмотренных случаях нелинейный композитный регулятор сохраняет устойчивость системы и демонстрирует лучшую эффективность по рассматриваемому критерию качества. Рассмотрена также задача стабилизации дискретной модели двухколесной мобильной робототехнической платформы. Показано, что построенный нелинейный регулятор, обладает лучшим качеством работы и более широкой областью допустимых изменений параметров модели по сравнению с линейным регулятором. Был сделан вывод об области применимости разработанного метода синтеза нелинейного композитного управления. Полученный метод целесообразно применять в тех случаях, когда использование линейного композитного регулятора не обеспечивает приемлемого качества управления или запаса устойчивости при изменениях параметров модели и когда удается достаточно легко гарантировать выполнение одного из необходимых условий разработанного метода. Как было продемонстрировано, к такому классу задач относится, в частности, стабилизация гибкого робота-манипулятора с одним звеном.
1. Айтыгулов Э., Киселёв Г., Панов А. Task and Spatial Planning by the Cognitive Agent with Human-like Knowledge Representation // Interactive Collaborative Robotics, p. 1-12 (год публикации — 2018).
2. Андрейчук А. А., Яковлев К. С. Path Finding for the Coalition of Co-operative Agents Acting in the Environment with Destructible Obstacles // Interactive Collaborative Robotics. ICR 2018, Pp. 13-22 (год публикации — 2018).
3. Андрейчук А. А., Яковлев К. С. Two Techniques That Enhance the Performance of Multi-robot Prioritized Path Planning // Proceedings of the 17th International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2018), Stockholm, Sweden, July 10–15, 2018, Vol. 3, pp. 2177-2179 (год публикации — 2018).
4. Андрейчук А. А., Яковлев К. С. Метод планирования траекторий для группы агентов, обладающих возможностью модификации окружающей среды // Информатика, управление и системный анализ: Труды V Всероссийской научной конференции молодых ученых с международным участием, С. 73-82 (год публикации — 2018).
5. Даник Ю. Э., Дмитриев М. Г., Макаров Д. А. Stabilizing regulators for nonlinear continuous systems of large dimension using the asymptotics of the matrix algebraic Riccati equations solutions // Proceedings of 10th International Conference Management of Large-Scale System Development, MLSD 2018. (год публикации — 2018).
6. Осипов Г. С. Sign-Based Representation and World Model of Actor // Practical Issues of Intelligent Innovations, pp. 215-230 (год публикации — 2018).
7. Панов А. И., Скрынник А. А. Automatic formation of the structure of abstract machines in hierarchical reinforcement learning with state clustering // ArXiv (год публикации — 2018).
8. Хачумов М. В., Хачумов В. М. The problems of route and motion planning for an autonomous flight vehicle in uncertain environment // 2018 Moscow Workshop on Electronic and Networking Technologies (MWENT). Proceedings, p. 1-6 (год публикации — 2018).
9. Даник Ю. Э., Дмитриев М. Г., Макаров Д. А. Стабилизирующие регуляторы в нелинейных непрерывных системах большой размерности на основе асимптотики решений матричных алгебраических уравнений Риккати // Материалы XI международной конференции «Управление развитием крупномасштабных систем MLSD2018», 1-3 октября 2018 г., Москва, Т. 2. С. 351-353 (год публикации — 2018).
В ходе отчётного этапа рассматривались задачи планирования траектории, картирования и локализации, представления знаний. Предложены новые, оригинальные методы, алгоритмы и модели. Опубликовано 9 работ.
Была рассмотрена задача планирования совокупности неконфликтных траекторий для группы интеллектуальных агентов с возможностью совершения перемещения произвольной продолжительности и в произвольном направлении. Для решения этой задачи был предложен новый алгоритм, основанный на комбинации конфликтно-ориентированного поиска и безопасно-интервального планирования. Проведены теоретические и эмпирические исследования алгоритма. Доказана его корректность, полнота и оптимальность. Результаты экспериментальных исследований свидетельствуют о применимости алгоритма для решения широкого класса задач. Разработанный алгоритм превосходит известные мировые аналоги по качеству отыскиваемых решений (сумма времён достижения целей по всем агентам) за счёт возможности осуществлять действия в произвольном направлении. По результатам эксперимента разница достигает 21%. Программная реализация разработанного алгоритма открыта и доступна по ссылке https://github.com/PathPlanning/Continuous-CBS
Была рассмотрена задача планирования траектории на плоскости и предложен новый подход к её решению, основанный на применении генеративно-состязательных нейросетей. Целью генеративной компоненты является создание изображения-решения задачи планирования по имеющемуся изображению, на котором представлена окружающая среда агента, а также отмечены текущее и целевое положения. При обучении в качестве эталонных используются изображения с нанесённым путём, найденным с помощью алгоритма A*. Дискриминативная компонента решает задачу бинарной классификации, т. е. определяет, относится ли изображение, поданное на вход, к классу эталонных или сгенерированных. В результате проведённых экспериментальных исследований установлена потенциальная применимость предложенной генеративной модели в задаче планирования траектории на плоскости. Число успешно решенных заданий превысило 72%. Модель показала способность к генерализации (т. е. возможность отыскания путей на картах, которые существенным образом отличаются от примеров, на которых происходило обучение). Результаты, полученные в ходе работы, показали релевантность модели как инструмента для решения задачи планирования, а также потенциал в дальнейшем развитии предложенного подхода.
Рассматривалась задача одновременного картирования и локализации по видеопотоку (vSLAM) в реальном времени для малогабаритной робототехнической системы. Предложен метод картирования и локализации, основанный на восстановлении карт глубин изображений и алгоритме RTAB-Map. Для восстановления глубин по изображениям разработаны архитектуры полносверточных нейронных сетей, обладающие высокой скоростью работы на маломощных встраиваемых системах. Проведено экспериментальное исследование полученных архитектур и их сравнение с другими методами восстановления глубины. В ходе исследования установлено, что разработанные архитектуры не уступают по скорости и качеству многим другим современным архитектурам полносверточных нейронных сетей. Также проведено тестирование предложенного метода vSLAM в реальном времени на встраиваемой системе NVIDIA Jetson TX2, в ходе которого установлено, что предложенный метод позволяет строить правдоподобную карту окружающей местности и выполняет локализацию в построенной карте с частотой 16 раз в секунду. Предложенный метод vSLAM программно реализован в формате ROS-узла. Программная реализация доступна по ссылке https://github.com/cnndepth/tx2_fcnn_node
Предложена модель представления и обработки процедурных знаний робототехнических систем, которая определяется множеством типовых элементарных подзадач поведения, описываемых на основе фрейм-микропрограмм и фрейм-операций. Фреймовые структуры используют специальные процедуры вывода и позволяют формировать сложные программы функционирования, обеспечивающие решение задач в процессе целенаправленной деятельности в условиях неопределённости. Разработанные процедуры обработки знаний могут лечь в основу создания систем управления специализированными робототехническими системами, обладающими высокими функциональными возможностями. Дана постановка и предложено решение задачи траекторного движения группы беспилотных летательных аппаратов в сложных условиях. Сформулированы основные требования и ограничения к системе управления траекторным движением. Предложен алгоритм динамического планирования поведения группы БПЛА в среде с препятствиями. Получено решение задачи построения и отработки сложной траектории движения беспилотного летательного аппарата с применением локальных интерполирующих сплайнов и оптимизацией расположения узловых точек. Даны постановки и предложены схемы решения задач преследования-убегания для группы беспилотных летательных аппаратов в качестве преследователей и динамической цели при ветровой нагрузке в среде с препятствиями.
1. Андрейчук А. А., Яковлев К. С., Атцмон Д., Штерн Р. Multi-Agent Pathfinding with Continuous Time // Proceedings of the 28th International Joint Conference on Artificial Intelligence (IJCAI 2019), Pp. 39-45 (год публикации — 2019).
2. Боковой А. В., Муравьёв К. Ф., Яковлев К. С. Real-time Vision-based Depth Reconstruction with NVidia Jetson // Proceedings of the 2019 European Conference on Mobile Robots (ECMR 2019) (год публикации — 2019).
3. Дергачёв С. А. Экспериментальное исследование реактивного алгоритма навигации для групп агентов — ORCA // Семнадцатая Национальная конференция по искусственному интеллекту с международным участием. КИИ-2019 (21–25 октября 2019 г., г. Ульяновск, Россия). Сборник научных трудов. В 2 т., Т.1. С.102-110 (год публикации — 2019).
4. Мелехин В. Б., Хачумов М. В. Планирование выполнения сложных полетных заданий группировками интеллектуальных беспилотных летательных аппаратов // Искусственный интеллект и принятие решений, №2, 2019. С. 72-83. (год публикации — 2019).
5. Муравьёв К. Ф., Боковой А. В. Восстановление карт глубин изображений, полученных с единственной видеокамеры в реальном времени на платформе NVIDIA Jetson TX // Пятый Всероссиийский научно-практический семинар «Беспилотные транспортные средства с элементами искусственного интеллекта» (БТС-ИИ-2019): Труды семинара., С. 29-38 (год публикации — 2019).
6. Соболева Н. А., Яковлев К. С. LPLIAN: алгоритм планирования траектории с учетом геометрических ограничений в динамической среде // Пятый Всероссиийский научно-практический семинар «Беспилотные транспортные средства с элементами искусственного интеллекта» (БТС-ИИ-2019): Труды семинара, С. 56-65 (год публикации — 2019).
7. Соболева Н. А., Яковлев К. С. GAN Path Finder: Preliminary results // In Benzmüller C., Stuckenschmidt H. (eds) KI 2019: Advances in Artificial Intelligence. KI 2019. Lecture Notes in Computer Science, vol 11793., Pp. 316-324. (год публикации — 2019).
8. Хачумов М. В. A Rule-Based Approach for Controlling UAVs Formation Flight // Ronzhin A., Shishlakov V. (eds) Proceedings of 14th International Conference on Electromechanics and Robotics “Zavalishin's Readings”. Smart Innovation, Systems and Technologies, vol 154., Pp. 319-330 (год публикации — 2020).
9. Хачумов М. В., Хачумов В. М. UAV Trajectory Tracking Based on Local Interpolating Splines and Optimal Choice of Knots // Kuznetsov S., Panov A. (eds) Artificial Intelligence. RCAI 2019. Communications in Computer and Information Science, vol 1093., Pp. 320-334 (год публикации — 2019).
10. Алгоритм российских учёных поможет роботам безопасно передвигаться // Индикатор.ру, ссылка (год публикации — 2019).
Была рассмотрена задача планирования совокупности неконфликтных траекторий для группы мобильных агентов. Разработана модификация алгоритма многоагентного планирования, основанная на комбинации подходов конфликтно-ориентированного поиска и безопасно-интервального планирования. Предложенная модификация позволяет учитывать ориентацию агентов, время необходимое на её смену, размеры, форму, скорость движения и поворота. При этом допускается, что агенты могут быть гетерогенными, т. е. обладать различными характеристиками. Предложен ряд оригинальных вспомогательных процедур, позволяющих сократить пространство поиска при планировании индивидуальных траекторий агентов, и, как следствие, оказывающих положительное влияние на время работы алгоритма. В результате проведения экспериментальных исследований установлено, что предложенный метод не уступает предшественнику (алгоритму, разработанному годом ранее) в скорости решения задач многоаганетного планирования, при том, что последний предназначен для гомогенных агентов и не учитывает ориентацию (и, соответственно, скорость вращения) агентов при планировании. Исходный код разработанного метода доступен для сообщества: https://github.com/PathPlanning/Continuous-CBS/tree/CCBS-kc
Рассматривалась задача планирования пути на плоскости в статической среде как задача контекстно-зависимой генерации изображения. Был предложен ряд модификаций предложенной ранее нейросетевой генеративно-состязательной модели для решения этой задачи. Модификации касаются использования блоков внимания в архитектуре нейронной сети, а также расчёта функции потерь дискриминатора. Также предложен оригинальный способ комбинирования предсказаний вероятности нахождения пути в определённой области пространства и метода планирования, основанного на систематическом поиске. Экспериментально показано, что предложенный комбинированный метод существенно повышает вычислительную эффективность планирования траектории на плоскости при решении ряда практически значимых задач. Исходный код разработанной модели выложен в открытый доступ: https://github.com/PathPlanning/GAN-Path-Finder
Исследовалась задача одновременного картирования и локализации по видеопотоку нескольких робототехнических систем. Разработан комплексный метод её решения. Ключевым компонентом комплекса является нейросетевой метод восстановления глубины, разработанный на прошлом этапе работ по проекту, и способный обрабатывать видеопоток в реальном времени (при частоте обновления кадров 30 раз в секунду). Другими компонентами комплекса являются метод одновременного картирования и локализации по RGB-D данным и метод слияния индивидуальных карт. Комплекс является модульным и допускает возможность замены отдельных алгоритмов, исходный код его компонент находится в открытом доступе: https://github.com/CnnDepth/tx2_fcnn_node С использованием фотореалистичного симулятора Habitat разработана коллекция данных для проведения экспериментальных исследований алгоритмов объединения карт. Коллекция находится в открытом доступе: https://github.com/CnnDepth/matterport_overlapping_maps С её использованием проведено экспериментальное исследование разработанного комплекса. Результаты показали состоятельность предложенного подхода для решения задачи картирования и локализации нескольких робототехнических систем в реальном времени.
Разработана концепция интеллектуально-геометрического управления, направленная на решение задачи совместного применения в составе роботизированной системы дополняющих друг друга методов точного геометрического и гибкого интеллектуального управления. Дана общая постановка задачи безопасного формирования строя БПЛА в недетерминированной среде при наличии ветровой нагрузки и препятствий. Разработана общая схема решения задачи формирования строя, предполагающая получение опорного плана и его последовательное улучшение. Опорный план формируется путём решения задачи о назначениях модифицированным венгерским методом. Осуществлён выбор математических и имитационных моделей летательных аппаратов как объектов интеллектуально-геометрического управления. Разработана система моделирования, которая содержит специальные модули оперативного реагирования на изменения во внешней среде. Получено экспериментальное решение различных траекторных задач, включая задачи формирования строя и преследования-убегания в сложных условиях.
1. Андрейчук А. А. Multi-agent Path Finding with Kinematic Constraints via Conflict Based Search // RCAI 2020. Lecture Notes in Computer Science, vol 12412., C.29-45 (год публикации — 2020).
2. Боковой А. В., Муравьёв К. Ф., Яковлев К. С. Map-merging algorithms for visual slam: Feasibility study and empirical evaluation // RCAI 2020. Lecture Notes in Computer Science, vol 12412., С. 46-60 (год публикации — 2020).
3. Муравьёв К. Ф., Боковой А. В., Яковлев К. С. Оценка качества алгоритмов картирования и локализации на основе видеоданных в симуляционных средах // Завалишинские чтения'20: XV Международная конференция по электромеханике и робототехнике, с.129-135 (год публикации — 2020).
4. Соболева Н. А., Яковлев К. С. LPLian: Angle-Constrained Path Finding in Dynamic Grids // 12th International Conference on Developments in eSystems Engineering (DeSE 2019), pp. 48-53 (год публикации — 2020).
5. Хачумов М. В. Tactical Level of Intelligent Geometric Control System for Unmanned Aerial Vehicles // Ronzhin A., Shishlakov V. (eds) Proceedings of 15th International Conference on Electromechanics and Robotics "Zavalishin's Readings". Smart Innovation, Systems and Technologies, vol 187. Pp.55-67 (год публикации — 2021).