AI Google учит роботов, как двигаться, наблюдая за собаками

Исследователи Google разработали Система искусственного интеллекта который учится на движениях животных, чтобы дать роботам большую ловкость, показывает препринт бумага и Сообщение блога опубликовано на этой неделе. Соавторы полагают, что их подход может поддержать разработку роботов, которые могут выполнять задачи в реальном мире, например, транспортировку материалов между многоуровневыми складами и центрами выполнения.

Среда команд берет клип захвата движения животного — в данном случае собаку — и использует обучение с подкреплением, методику обучения, которая подстегивает программных агентов для достижения целей с помощью наград, для обучения политике контроля. Обеспечение системы различными опорными движениями позволило исследователям «научить» четвероногого робота Unitree Laikago выполнять различные действия, как они говорят, от быстрой ходьбы (со скоростью до 2,6 миль в час) до прыжков и поворотов. ,

Чтобы подтвердить свой подход, исследователи сначала собрали набор данных о реальных собаках, выполняющих различные навыки. (Обучение в основном проходило в физическом моделировании, так что позу опорных движений можно было тщательно отслеживать.) Затем, используя различные движения в функции вознаграждения (которая описывает, как агенты ведут себя), исследователи обучили около 200 миллион образцов моделируемого робота для имитации навыков движения.

Но симуляторы обычно дают приблизительное представление о реальном мире. Чтобы решить эту проблему, исследователи использовали технику адаптации, которая рандомизировала динамику в симуляции, например, изменение физических величин, таких как масса и трение робота. Эти значения были сопоставлены с помощью кодера с числовым представлением, то есть с кодировкой, которая была передана в качестве входных данных для политики управления роботом. При развертывании политики на реальном роботе, исследователи удалили кодировщик и непосредственно искали набор переменных, которые позволили роботу успешно выполнять навыки.

VB TRansform 2020: AI событие для лидеров бизнеса. Сан-Франциско 15-16 июля

Команда говорит, что им удалось адаптировать политику к реальному миру, используя менее 8 минут реальных данных в течение примерно 50 испытаний. Более того, они продемонстрировали, что реальный робот научился имитировать различные движения собаки, включая ход и рысь, а также анимационные движения ключевых кадров, такие как динамический поворот прыжка.

«Мы показываем, что, используя эталонные данные движения, единый подход, основанный на обучении, способен автоматически синтезировать контроллеры для разнообразного репертуара (поведения) для роботов на ножках», — написали соавторы в статье. «Благодаря внедрению примеров эффективных методов адаптации предметной области в учебный процесс наша система способна изучать адаптивные политики в процессе моделирования, которые затем можно быстро адаптировать для реального развертывания».

Google робот симуляция

Политика управления не была идеальной — из-за алгоритмических и аппаратных ограничений она не могла изучать высокодинамичные поведения, такие как большие скачки и пробежки, и не была столь же стабильной, как лучшие контроллеры, разработанные вручную. (В 5 эпизодах, всего 15 испытаний на метод, реальный робот упал в среднем через 6 секунд во время стимуляции; через 5 секунд при движении назад, 9 секунд во время вращения; и 10 секунд во время прыжка.) Исследователи оставьте для будущей работы улучшение надежности контроллера и разработку платформ, которые могут учиться на других источниках данных движения, таких как видеоклипы.



Источник: AI Google учит роботов, как двигаться, наблюдая за собаками


Похожие материалы по теме: AI Google учит роботов, как двигаться, наблюдая за собаками

Leave a comment