Отступление - Backstepping

В теория управления, бэкстеппинг - это техника, разработанная около 1990 г. Петр В. Кокотович и другие[1][2] для проектирования стабилизирующий элементы управления для особого класса нелинейный динамические системы. Эти системы построены из подсистем, исходящих из несводимой подсистемы, которую можно стабилизировать каким-либо другим методом. Из-за этого рекурсивный структура, разработчик может начать процесс проектирования в заведомо стабильной системе и "откатить" новые контроллеры, которые постепенно стабилизируют каждую внешнюю подсистему. Процесс завершается, когда достигается окончательное внешнее управление. Следовательно, этот процесс известен как отступление.[3]

Обратный подход

Обратный подход обеспечивает рекурсивный метод для стабилизирующий то источник системы в форма строгой обратной связи. То есть рассмотрим система формы[3]

куда

  • с ,
  • находятся скаляры,
  • ты это скаляр вход в систему,
  • исчезнуть на источник (т.е. ),
  • отличны от нуля в интересующей области (т. е. за ).

Также предположим, что подсистема

является стабилизированный к источник (т.е. ) некоторыми известен контроль такой, что . Также предполагается, что Функция Ляпунова для этой стабильной подсистемы известно. То есть это Икс подсистема стабилизируется каким-либо другим методом, а обратный шаг увеличивает ее устойчивость до оболочка вокруг него.

В системах этого форма строгой обратной связи вокруг конюшни Икс подсистема,

  • Управляющий вход, разработанный в обратном направлении ты оказывает самое непосредственное стабилизирующее воздействие на состояние .
  • Штат затем действует как стабилизирующий контроль над состоянием перед этим.
  • Этот процесс продолжается так, что каждое состояние стабилизируется фиктивный "контроль" .

В отступление подход определяет, как стабилизировать Икс подсистема, использующая , а затем переходит к определению, как сделать следующее состояние водить машину к контролю, необходимому для стабилизации Икс. Следовательно, процесс «отступает» от Икс вне системы форм строгой обратной связи до окончательного контроля ты разработан.

Обзор конструкции рекурсивного управления

  1. Принято, что меньшая (то есть младшая) подсистема
    уже стабилизирован к началу некоторого контроля куда . То есть выбор для стабилизации этой системы необходимо использовать какой-то другой метод. Также предполагается, что Функция Ляпунова для этой стабильной подсистемы известно. Backstepping позволяет расширить управляемую стабильность этой подсистемы на более крупную систему.
  2. Контроль спроектирован так, что система
    стабилизируется так, чтобы следует желаемому контроль. Дизайн управления основан на расширенной функции Ляпунова кандидата
    Контроль можно выбрать для привязки от нуля.
  3. Контроль спроектирована так, что система
    стабилизируется так, чтобы следует желаемому контроль. Дизайн управления основан на расширенной функции Ляпунова кандидата
    Контроль можно выбрать для привязки от нуля.
  4. Этот процесс продолжается до фактического ты известно, и
    • В настоящий контроль ты стабилизирует к фиктивный контроль .
    • В фиктивный контроль стабилизирует к фиктивный контроль .
    • В фиктивный контроль стабилизирует к фиктивный контроль .
    • ...
    • В фиктивный контроль стабилизирует к фиктивный контроль .
    • В фиктивный контроль стабилизирует к фиктивный контроль .
    • В фиктивный контроль стабилизирует Икс к происхождению.

Этот процесс известен как отступление потому что он начинается с требований к некоторой внутренней подсистеме для стабильности и постепенно отступает вне системы, сохраняя стабильность на каждом этапе. Потому что

  • исчезнуть в начале координат для ,
  • отличны от нуля для ,
  • данный контроль имеет ,

то получившаяся система имеет равновесие в точке источник (т.е. где , , , ..., , и ) то есть глобально асимптотически устойчивый.

Интегратор Backstepping

Перед описанием процедуры отступления для общих форма строгой обратной связи динамические системы, удобно обсудить подход для меньшего класса систем форм строгой обратной связи. Эти системы подключают ряд интеграторов ко входу системы с известным законом управления, стабилизирующим обратную связь, и поэтому стабилизирующий подход известен как отступление интегратора. С небольшой модификацией подход обратного шага интегратора может быть расширен для обработки всех систем форм строгой обратной связи.

Равновесие с одним интегратором

Рассмотрим динамическая система

 

 

 

 

(1)

куда и является скаляром. Эта система является каскадное соединение из интегратор с Икс подсистема (т.е. вход ты входит в интегратор, а интеграл входит в Икс подсистема).

Мы предполагаем, что , так что если , и , тогда

Итак источник является равновесием (т.е. стационарный пункт ) системы. Если система когда-либо достигнет источника, она останется там навсегда.

Один интегратор Backstepping

В этом примере обратный шаг используется для стабилизировать система с одним интегратором в уравнении (1) вокруг своего равновесия в начале координат. Чтобы быть менее точным, мы хотим разработать закон управления это гарантирует, что государства Вернуться к после запуска системы из произвольного начального состояния.

  • Во-первых, по предположению подсистема
с имеет Функция Ляпунова такой, что
куда это положительно определенная функция. То есть мы предполагать что у нас есть уже показано что это существующие проще Икс подсистема является стабильный (по Ляпунову). Грубо говоря, это понятие стабильности означает, что:
    • Функция подобна «обобщенной энергии» Икс подсистема. Поскольку Икс состояния системы удаляются от начала координат, энергия тоже растет.
    • Показывая, что со временем энергия спадает до нуля, затем Икс государства должны распасться к . То есть происхождение будет стабильное равновесие системы - Икс состояния будут непрерывно приближаться к источнику с увеличением времени.
    • Говоря это положительно определенный означает, что везде кроме , и .
    • Заявление о том, что Значит это отделена от нуля для всех точек, кроме тех, где . То есть, пока система не находится в равновесии в начале координат, ее «энергия» будет уменьшаться.
    • Поскольку энергия всегда спадает, система должна быть стабильной; его траектории должны приближаться к началу координат.
Наша задача найти контроль ты что делает наш каскадный система также стабильна. Итак, мы должны найти новый Функция Ляпунова кандидат для этой новой системы. Этот кандидат будет зависеть от контроля ты, и, правильно подобрав элемент управления, мы можем гарантировать, что он также везде распадается.
  • Далее добавление и вычитание (т.е. мы никоим образом не меняем систему, потому что не делаем сеть эффект) к часть большего система, становится
которые мы можем перегруппировать, чтобы получить
Итак, наша каскадная суперсистема инкапсулирует заведомо стабильную подсистема плюс некоторое возмущение ошибки, генерируемое интегратором.
  • Теперь мы можем изменить переменные из к позволяя . Так
Кроме того, мы позволяем так что и
Мы стремимся стабилизировать это система ошибок по обратной связи через новый элемент управления . За счет стабилизации системы на , штат будет отслеживать желаемый контроль что приведет к стабилизации внутреннего Икс подсистема.
  • Из нашей существующей функции Ляпунова , мы определяем дополненный Функция Ляпунова кандидат
Так
Распространяя , Мы видим, что
Чтобы гарантировать, что (т.е. для обеспечения устойчивости надсистемы) выбирать закон контроля
с , и так
После распространения через,
Итак, наш кандидат Функция Ляпунова является правда Функция Ляпунова, и наша система стабильный под этим законом контроля (что соответствует закону управления потому что ). Используя переменные из исходной системы координат, эквивалентная функция Ляпунова

 

 

 

 

(2)

Как обсуждается ниже, эта функция Ляпунова будет использоваться снова, когда эта процедура применяется итеративно к задаче с несколькими интеграторами.
  • Наш выбор управления в конечном итоге зависит от всех наших исходных переменных состояния. В частности, реальный закон управления, стабилизирующий обратную связь

 

 

 

 

(3)

Штаты Икс и и функции и приходят из системы. Функция происходит из нашей заведомо-стабильной подсистема. В прирост параметр влияет на скорость сходимости или нашу систему. Согласно этому закону контроля наша система стабильный в начале .
Напомним, что в уравнении (3) управляет входом интегратора, подключенного к подсистеме, стабилизированной по закону управления . Неудивительно, что контроль имеет срок, который будет интегрирован в соответствии с законом стабилизирующего контроля плюс некоторое смещение. Другие члены обеспечивают демпфирование, чтобы удалить это смещение и любые другие эффекты возмущения, которые могут усилиться интегратором.

Так как эта система стабилизирована обратной связью и имеет функцию Ляпунова с , его можно использовать как верхнюю подсистему в другой каскадной системе с одним интегратором.

Мотивирующий пример: отступление двух интеграторов

Прежде чем обсуждать рекурсивную процедуру для общего случая множественных интеграторов, поучительно изучить рекурсию, имеющуюся в случае двух интеграторов. То есть рассмотрим динамическая система

 

 

 

 

(4)

куда и и скаляры. Эта система представляет собой каскадное соединение системы с одним интегратором в уравнении (1) с другим интегратором (т. е. входом поступает через интегратор, и выход этого интегратора входит в систему в уравнении (1) своим Вход).

Позволяя

  • ,
  • ,

тогда система с двумя интеграторами в уравнении (4) превращается в систему с одним интегратором

 

 

 

 

(5)

По процедуре единственного интегратора закон управления стабилизирует верхнюю -к-у подсистема с использованием функции Ляпунова , и поэтому уравнение (5) представляет собой новую систему с одним интегратором, которая структурно эквивалентна системе с одним интегратором в уравнении (1). Итак, стабилизирующий контроль можно найти с помощью той же процедуры с одним интегратором, которая использовалась для поиска .

Отступление многих интеграторов

В случае с двумя интеграторами верхняя подсистема с одним интегратором была стабилизирована, давая новую систему с одним интегратором, которую можно стабилизировать аналогичным образом. Эта рекурсивная процедура может быть расширена для обработки любого конечного числа интеграторов. Это утверждение можно формально доказать с помощью математическая индукция. Здесь стабилизированная система с несколькими интеграторами построена из подсистем уже стабилизированных подсистем с несколькими интеграторами.

со скалярным вводом и состояния вывода . Предположить, что
    • так что нулевой вход (т. е. ) система стационарный в начале . В этом случае начало координат называется равновесие системы.
    • Закон управления с обратной связью стабилизирует систему в состоянии равновесия в начале координат.
    • А Функция Ляпунова соответствующий этой системе описывается .
То есть, если состояние вывода Икс возвращаются на вход по закону контроля , то выходные состояния (и функция Ляпунова) возвращаются в начало координат после однократного возмущения (например, после ненулевого начального условия или резкого возмущения). Эта подсистема стабилизированный по закону управления с обратной связью .
  • Затем подключите интегратор для ввода так что расширенная система имеет ввод (к интегратору) и состояния выхода Икс. Результирующая расширенная динамическая система имеет вид
Эта «каскадная» система соответствует форме в уравнении (1), поэтому процедура обратного шага с одним интегратором приводит к стабилизирующему закону управления в уравнении (3). То есть, если мы возвращаем состояния и Икс для ввода согласно закону контроля
с прибылью , то состояния и Икс вернется к и после однократного возмущения. Эта подсистема стабилизированный по закону управления с обратной связью , и соответствующая функция Ляпунова из уравнения (2) является
То есть по закону управления с обратной связью , функция Ляпунова спадает до нуля, когда состояния возвращаются в исходное состояние.
  • Подключите новый интегратор к входу так что расширенная система имеет ввод и состояния вывода Икс. Результирующая расширенная динамическая система имеет вид
что эквивалентно Один-интеграторная система
Используя эти определения , , и , эту систему также можно выразить как
Эта система соответствует структуре с одним интегратором уравнения (1), и поэтому процедура обратного шага с одним интегратором может быть применена снова. То есть, если мы возвращаем состояния , , и Икс для ввода согласно закону контроля
с прибылью , то состояния , , и Икс вернется к , , и после однократного возмущения. Эта подсистема стабилизированный по закону управления с обратной связью , а соответствующая функция Ляпунова есть
То есть по закону управления с обратной связью , функция Ляпунова спадает до нуля, когда состояния возвращаются в исходное состояние.
  • Подключите интегратор ко входу так что расширенная система имеет ввод и состояния вывода Икс. Результирующая расширенная динамическая система имеет вид
которые можно перегруппировать как Один-интеграторная система
По определениям , , и из предыдущего шага эта система также представлена
Далее, используя эти определения , , и , эту систему также можно выразить как
Таким образом, перегруппированная система имеет структуру с одним интегратором уравнения (1), и поэтому процедура обратного шага с одним интегратором может быть применена снова. То есть, если мы возвращаем состояния , , , и Икс для ввода согласно закону контроля
с прибылью , то состояния , , , и Икс вернется к , , , и после однократного возмущения. Эта подсистема стабилизированный по закону управления с обратной связью , а соответствующая функция Ляпунова есть
То есть по закону управления с обратной связью , функция Ляпунова спадает до нуля, когда состояния возвращаются в исходное состояние.
  • Этот процесс может продолжаться для каждого интегратора, добавленного в систему, и, следовательно, для любой системы вида
имеет рекурсивную структуру
и может быть стабилизирован с обратной связью путем нахождения стабилизирующего обратную связь управления и функции Ляпунова для одиночного интегратора подсистема (т.е. с вводом и вывод Икс) и повторение этой внутренней подсистемы до окончательного управления, стабилизирующего обратную связь. ты известен. На итерации я, эквивалентная система
Соответствующий закон управления, стабилизирующий обратную связь, имеет вид
с прибылью . Соответствующая функция Ляпунова есть
Благодаря этой конструкции окончательный контроль (т.е. окончательный контроль находится на последней итерации ).

Следовательно, любая система в этой специальной форме строгой обратной связи со многими интеграторами может быть стабилизирована с использованием обратной связи с помощью простой процедуры, которую можно даже автоматизировать (например, как часть адаптивное управление алгоритм).

Стандартный шаг назад

Системы в специальном форма строгой обратной связи имеют рекурсивную структуру, аналогичную структуре системы со многими интеграторами. Точно так же они стабилизируются путем стабилизации самой маленькой каскадной системы, а затем отступление к следующей каскадной системе и повторением процедуры. Поэтому очень важно разработать пошаговую процедуру; эту процедуру можно рекурсивно применить для многоступенчатого случая. К счастью, из-за требований к функциям в форме строгой обратной связи, каждая одношаговая система может быть визуализирована с помощью обратной связи в систему с одним интегратором, и эта система с одним интегратором может быть стабилизирована с использованием методов, описанных выше.

Одношаговая процедура

Рассмотрим простой строгая обратная связь система

 

 

 

 

(6)

куда

  • ,
  • и находятся скаляры,
  • Для всех Икс и , .

Вместо разработки управления со стабилизацией обратной связи напрямую, ввести новый элемент управления (будет разработан потом) и использовать закон контроля

что возможно, потому что . Итак, система в уравнении (6) является

что упрощает

Этот новый -к-Икс system matches the single-integrator cascade system в уравнении (1). Assuming that a feedback-stabilizing control law и Функция Ляпунова for the upper subsystem is known, the feedback-stabilizing control law from Equation (3) является

с прибылью . So the final feedback-stabilizing control law is

 

 

 

 

(7)

с прибылью . The corresponding Lyapunov function from Equation (2) является

 

 

 

 

(8)

Because this strict-feedback system has a feedback-stabilizing control and a corresponding Lyapunov function, it can be cascaded as part of a larger strict-feedback system, and this procedure can be repeated to find the surrounding feedback-stabilizing control.

Many-step Procedure

As in many-integrator backstepping, the single-step procedure can be completed iteratively to stabilize an entire strict-feedback system. In each step,

  1. The smallest "unstabilized" single-step strict-feedback system is isolated.
  2. Feedback is used to convert the system into a single-integrator system.
  3. The resulting single-integrator system is stabilized.
  4. The stabilized system is used as the upper system in the next step.

То есть любой strict-feedback system

has the recursive structure

and can be feedback stabilized by finding the feedback-stabilizing control and Lyapunov function for the single-integrator subsystem (i.e., with input and output Икс) and iterating out from that inner subsystem until the ultimate feedback-stabilizing control ты известен. At iteration я, the equivalent system is

By Equation (7), the corresponding feedback-stabilizing control law is

с прибылью . By Equation (8), the corresponding Lyapunov function is

By this construction, the ultimate control (i.e., ultimate control is found at final iteration ).Hence, any strict-feedback system can be feedback stabilized using a straightforward procedure that can even be automated (e.g., as part of an адаптивное управление алгоритм).

Смотрите также

Рекомендации

  1. ^ Kokotovic, P.V. (1992). "The joy of feedback: nonlinear and adaptive". Журнал IEEE Control Systems. 12 (3): 7–17. Дои:10.1109/37.165507.
  2. ^ Lozano, R.; Brogliato, B. (1992). "Adaptive control of robot manipulators with flexible joints". IEEE Transactions по автоматическому контролю. 37 (2): 174–181. Дои:10.1109/9.121619.
  3. ^ а б Халил, Х.К. (2002). Нелинейные системы (3-е изд.). Река Аппер Сэдл, штат Нью-Джерси: Prentice Hall. ISBN  978-0-13-067389-3.