Программирование путем демонстрации - Programming by demonstration

В Информатика, программирование путем демонстрации (PbD) является разработка для конечных пользователей Методика обучения компьютера или робота новому поведению путем демонстрации задачи для непосредственной передачи вместо программирования с помощью машинных команд.

Условия программирование на примере (PbE) и программирование путем демонстрации (PbD) появился в исследованиях разработки программного обеспечения еще в середине 1980-х.[1] чтобы определить способ определения последовательности операций без необходимости изучения языка программирования. Обычное различие в литературе между этими терминами состоит в том, что в PbE пользователь дает прототипный продукт выполнения на компьютере, такой как строка в желаемых результатах запроса; в то время как в PbD пользователь выполняет последовательность действий, которые компьютер должен повторить, обобщая ее для использования в различных наборах данных.

Эти два термина сначала были недифференцированными, но затем PbE, как правило, использовалась в основном исследователями программного обеспечения, в то время как PbD, как правило, принималась исследователями робототехники. Сегодня PbE относится к совершенно другой концепции, поддерживаемой новыми языками программирования, похожими на симуляторы. Этому фреймворку можно противопоставить Байесовский программный синтез.

Программирование роботов путем демонстрации

Парадигма PbD прежде всего привлекательна для индустрии робототехники из-за затрат, связанных с разработкой и обслуживанием программ роботов. В этой области оператор часто неявно знает задачу, которую необходимо решить (он / она знает, как это сделать), но обычно не имеет навыков программирования (или времени), необходимых для перенастройки робота. Таким образом, демонстрация того, как выполнить задачу на примерах, позволяет изучить навык без явного программирования каждой детали.

Первые стратегии PbD, предложенные в робототехнике, были основаны на Учить в, руководство или же воспроизведение методы, которые заключались в основном в перемещении робота (через специальный интерфейс или вручную) через набор соответствующих конфигураций, которые робот должен принимать последовательно (положение, ориентация, состояние захвата). Затем метод был постепенно улучшен за счет сосредоточения в основном на дистанционном управлении и использования различных интерфейсов, таких как зрение.

Однако в этих методах PbD все еще использовалось прямое повторение, которое было полезно в промышленности только при проектировании сборочной линии с использованием точно таких же компонентов продукта. Чтобы применить эту концепцию к продуктам с различными вариантами или применить программы к новым роботам, проблема обобщения стала решающим моментом. Чтобы решить эту проблему, первые попытки обобщить навык были в основном основаны на помощи пользователя через запросы о намерениях пользователя. Затем были предложены различные уровни абстракций для решения проблемы обобщения, в основном дихотомические методы обучения на символическом уровне или на уровне траектории.

Развитие гуманоидные роботы Естественно, демонстрация вызвала растущий интерес к программированию роботов. Поскольку человекоподобный робот по своей природе должен адаптироваться к новым условиям, важен не только внешний вид человека, но и алгоритмы, используемые для его управления, требуют гибкости и универсальности. Из-за постоянно меняющейся среды и огромного разнообразия задач, которые должен выполнять робот, роботу требуется способность постоянно осваивать новые навыки и адаптировать существующие навыки к новым условиям.

Исследования в области PbD также постепенно отошли от своей первоначальной чисто инженерной точки зрения и стали применять междисциплинарный подход, используя идеи нейробиологии и социальных наук для имитации процесса подражания у людей и животных. С увеличением внимания к этой работе в робототехнике понятие Программирование роботов путем демонстрации (также известный как RPD или RbD) также постепенно заменялся более биологической меткой Обучение путем подражания.

Параметризованные навыки

После того, как задача была продемонстрирована человеком-оператором, траектория хранится в базе данных. Упрощение доступа к необработанным данным достигается с помощью параметризованных навыков.[2] Навык запрашивает базу данных и генерирует траекторию. Например, сначала в базу данных о перемещениях отправляется навык «opengripper (slow)», и в ответ предоставляется сохраненное перемещение манипулятора. Параметры навыка позволяют изменять политику для выполнения внешних ограничения.

Навык - это интерфейс между названиями задач, приведенными в естественный язык и лежащие в основе пространственно-временной движение в трехмерном пространстве, состоящем из точек. Отдельные навыки можно объединить в задачу для определения более длительных последовательностей движений с точки зрения высокого уровня. Для практических приложений различные действия хранятся в библиотека навыков. Для дальнейшего повышения уровня абстракции навыки можно преобразовать в примитивы динамического движения (ДМП). Они генерируют траекторию робота «на лету», которая была неизвестна во время демонстрации. Это помогает повысить гибкость решателя.[3]

Использование без использования роботов

Для конечных пользователей, чтобы автоматизировать рабочий процесс в сложном инструменте (например, Фотошоп ), наиболее простым случаем PbD является регистратор макросов.

Смотрите также

Рекомендации

  1. ^ Халберт, Дэн (ноябрь 1984 г.). «Программирование на примере» (PDF). U.C. Беркли (кандидат наук). Получено 2012-07-28. Цитировать журнал требует | журнал = (помощь)
  2. ^ Первез, Аффан и Ли, Dongheui (2018). «Изучение параметризованных примитивов динамического движения с использованием смеси GMM» (PDF). Интеллектуальная сервисная робототехника. Springer. 11 (1): 61–78. Дои:10.1007 / s11370-017-0235-8.CS1 maint: несколько имен: список авторов (связь)
  3. ^ Ализаде, Тохид и Садуанов, Батырхан (2017). Программирование роботов путем демонстрации нескольких задач в общей среде. Международная конференция IEEE 2017 года по слиянию и интеграции мультисенсоров для интеллектуальных систем (MFI). IEEE. С. 608–613. Дои:10.1109 / mfi.2017.8170389.CS1 maint: несколько имен: список авторов (связь)

внешняя ссылка

Обзоры статей

Спецвыпуски в журналах

Ключевые лаборатории и люди

Ролики

Робот, который учится готовить омлет:

  • "Укороченная версия", YouTube, FR.
  • "Длинная версия", YouTube, FR.

Робот, который учится откручивать бутылку кокса:

  • "Отвинтить бутылку из-под кока-колы", YouTube, DE.