Оптимальные системы автоматического управления, страница 4

 (1)

     (2)

на интервале времени . То есть, решаем задачу Коши.

При интегрировании этой системы дифференциальных уравнений по формуле:

можно получить управление , которое доставляет минимум функционалу:

А теперь рассмотрим метод прогонки.

Полагаем, что векторы  и  связаны соотношением:

  (3)

Здесь  - квадратичная симметричная матрица размера , которое подлежит определению.

Продифференцируем уравнение (3) по времени:

  (4)

Подставим уравнения (3) и (4) в (2) и получим:

 (5)

Теперь (1) подставим в (5) и вновь учтем (3) и получим:

Или:

 (6)

Здесь учтено свойство симметрии матриц. То есть если  - симметричная матрица, то справедливо следующее соотношение:

Так как вектор , то из уравнения (6) следует:

 (7)

Это матричное дифференциальное уравнение Риккати.

Чтобы проинтегрировать выражение (7), вычислим значение  при . Для этого воспользуемся равенствами:

Приравняем правые части этих равенств:

Откуда следует:

 (8)

Уравнение (7) можно проинтегрировать (прогнать) от конечного значения  к начальному значению . Это так называемое интегрирование в обратном времени.

После этого с помощью уравнения:

вычислим начальное значение времени .

Теперь решение системы дифференциальных уравнений (1) и (2):

где начальные значения  и  заданы, может быть получено путем интегрирования в прямом времени. При выполнении интегрирования системы ДУ (1) и (2) с помощью формулы:

 (9)

можно вычислить уравнение системы в каждый момент времени. Отметим, что это уравнение по принципу обратной связи. При этом коэффициенты обратной связи:

являются переменными, то есть зависят от времени.

Линейная стационарная система с бесконечным временем управления

Задача формулируется следующим образом:

Имеется линейный объект управления:

 (1)

Рассмотрим случай, когда . При этом критерий качества системы может быть представлен следующим образом:

 (2)

Здесь  и  - положительно определенные матрицы.

Тогда уравнение Риккати запишется следующим образом:

 (3)

Здесь, в отличие от функционала:

, то граничное условие для матрицы  также будут нулевыми:

Решение уравнения Риккати, удовлетворявшее граничным условиям, обозначим . При это решение имеет предел:

Здесь - постоянная симметричная положительно определенная матрица, которая является решением матричного уравнения Риккати:

 (4)

В этом случае оптимальное управление принимает следующий вид:

 (5)

Теперь уравнение динамики системы запишется следующим образом:

 (6)

Из уравнение (5) следует, что и в этом случае оптимальное управление формируется по принципу обратной связи, и оказывается, что замкнутая система обладает свойством асимптотической устойчивости.

Задача оптимизации при ограничениях на управляющее воздействие

До сих пор мы рассматривали задачи, в которых рассматривается синтез регулятора, когда на управляющее воздействие не накладывается никаких ограничений. Это значит, что вектор управления  принадлежит открытой области. Но во многих задачах управления управляющее воздействие  ограничено. И наиболее часто это ограничение задается неравенствами:

   (1)

А это значит, что вектор управления принадлежит r-мерному кубу.

Рассмотрим общую задачу оптимизации, которая формулируется следующим образом:

Динамика системы описывается системой ДУ:

   (2)

Заданы граничные условия в начале движения системы и в конце:

   (3)

Требуется определить управление , которое переводит из заданного начального состояния системы (2) в конечное , и удовлетворяет ограничениям (1), и чтобы для этого управления , и соответствующей ему траектории , функционал:

 (4)

достигает минимума.

Здесь:

 - n-мерный вектор состояния системы;

 - r-мерный вектор управляющей функции.

Чтобы применить метод  вариационного исчисления для решения этой задачи, введем в рассмотрение вспомогательные управляющие функции  и вспомогательное соотношение:

  (5)

Вспомогательные зависимости (5) выберем таким образом, чтобы совокупность этих равенств позволила перейти от замкнутой области изменения переменных или управляющих функций  к открытой области для переменных , .

Такой переход может быть осуществлен различными способами, которые зависят от вида функции .

Например:

   (6)

Если функция  задана следующим образом, то для этой цели можно использовать функции вида:

    (7)

Здесь:

Теперь задачу оптимального управления можно сформулировать следующим образом:

Требуется определить функции , , которые удовлетворяют условиям (5), чтобы эти управления и соответствующая траектория  системы (2) доставляли минимум функционалу (4). Траектория  должна удовлетворять граничным условиям (3).

Эта задача представляет собой задачу Лагранжа на условный экстремум. В соответствии с методикой решения Лагранжа введем вспомогательный функционал:

  (8)

Составим уравнение Эйлера-Лагранжа:

    (9.1)

   (9.2)

  (9.3)

В этих уравнениях через обозначена функция:

К этим уравнениям надо добавить уравнение объекта (2) и соотношение (5), которые представляют собой уравнение Эйлера-Лагранжа по переменным , , , ,  для функционала (8).

В этом случае имеется переменных , , , , , для определения которых можно использовать уравнений (9.2) и условия (5).

Для определения r произвольных постоянных в общем решении уравнения Эйлера-Лагранжа нужно воспользоваться граничными условиями (3). Отметим, что управления , когда , в общем случае могут представлять собой кусочно-непрерывные функции времени.

Тогда в точках разрыва непрерывности управления траектория  системы (2) имеет излом. В этой точке должны выполняться условия Вейерштрасса - Эрмана, которые для данного случая имеют вид: