(1)
(2)
на интервале времени . То есть, решаем задачу Коши.
При интегрировании этой системы дифференциальных уравнений по формуле:
можно получить управление , которое доставляет минимум функционалу:
А теперь рассмотрим метод прогонки.
Полагаем, что векторы и связаны соотношением:
(3)
Здесь - квадратичная симметричная матрица размера , которое подлежит определению.
Продифференцируем уравнение (3) по времени:
(4)
Подставим уравнения (3) и (4) в (2) и получим:
(5)
Теперь (1) подставим в (5) и вновь учтем (3) и получим:
Или:
(6)
Здесь учтено свойство симметрии матриц. То есть если - симметричная матрица, то справедливо следующее соотношение:
Так как вектор , то из уравнения (6) следует:
(7)
Это матричное дифференциальное уравнение Риккати.
Чтобы проинтегрировать выражение (7), вычислим значение при . Для этого воспользуемся равенствами:
Приравняем правые части этих равенств:
Откуда следует:
(8)
Уравнение (7) можно проинтегрировать (прогнать) от конечного значения к начальному значению . Это так называемое интегрирование в обратном времени.
После этого с помощью уравнения:
вычислим начальное значение времени .
Теперь решение системы дифференциальных уравнений (1) и (2):
где начальные значения и заданы, может быть получено путем интегрирования в прямом времени. При выполнении интегрирования системы ДУ (1) и (2) с помощью формулы:
(9)
можно вычислить уравнение системы в каждый момент времени. Отметим, что это уравнение по принципу обратной связи. При этом коэффициенты обратной связи:
являются переменными, то есть зависят от времени.
Линейная стационарная система с бесконечным временем управления
Задача формулируется следующим образом:
Имеется линейный объект управления:
(1)
Рассмотрим случай, когда . При этом критерий качества системы может быть представлен следующим образом:
(2)
Здесь и - положительно определенные матрицы.
Тогда уравнение Риккати запишется следующим образом:
(3)
Здесь, в отличие от функционала:
, то граничное условие для матрицы также будут нулевыми:
Решение уравнения Риккати, удовлетворявшее граничным условиям, обозначим . При это решение имеет предел:
Здесь - постоянная симметричная положительно определенная матрица, которая является решением матричного уравнения Риккати:
(4)
В этом случае оптимальное управление принимает следующий вид:
(5)
Теперь уравнение динамики системы запишется следующим образом:
(6)
Из уравнение (5) следует, что и в этом случае оптимальное управление формируется по принципу обратной связи, и оказывается, что замкнутая система обладает свойством асимптотической устойчивости.
Задача оптимизации при ограничениях на управляющее воздействие
До сих пор мы рассматривали задачи, в которых рассматривается синтез регулятора, когда на управляющее воздействие не накладывается никаких ограничений. Это значит, что вектор управления принадлежит открытой области. Но во многих задачах управления управляющее воздействие ограничено. И наиболее часто это ограничение задается неравенствами:
(1)
А это значит, что вектор управления принадлежит r-мерному кубу.
Рассмотрим общую задачу оптимизации, которая формулируется следующим образом:
Динамика системы описывается системой ДУ:
(2)
Заданы граничные условия в начале движения системы и в конце:
(3)
Требуется определить управление , которое переводит из заданного начального состояния системы (2) в конечное , и удовлетворяет ограничениям (1), и чтобы для этого управления , и соответствующей ему траектории , функционал:
(4)
достигает минимума.
Здесь:
- n-мерный вектор состояния системы;
- r-мерный вектор управляющей функции.
Чтобы применить метод вариационного исчисления для решения этой задачи, введем в рассмотрение вспомогательные управляющие функции и вспомогательное соотношение:
(5)
Вспомогательные зависимости (5) выберем таким образом, чтобы совокупность этих равенств позволила перейти от замкнутой области изменения переменных или управляющих функций к открытой области для переменных , .
Такой переход может быть осуществлен различными способами, которые зависят от вида функции .
Например:
(6)
Если функция задана следующим образом, то для этой цели можно использовать функции вида:
(7)
Здесь:
Теперь задачу оптимального управления можно сформулировать следующим образом:
Требуется определить функции , , которые удовлетворяют условиям (5), чтобы эти управления и соответствующая траектория системы (2) доставляли минимум функционалу (4). Траектория должна удовлетворять граничным условиям (3).
Эта задача представляет собой задачу Лагранжа на условный экстремум. В соответствии с методикой решения Лагранжа введем вспомогательный функционал:
(8)
Составим уравнение Эйлера-Лагранжа:
(9.1)
(9.2)
(9.3)
В этих уравнениях через обозначена функция:
К этим уравнениям надо добавить уравнение объекта (2) и соотношение (5), которые представляют собой уравнение Эйлера-Лагранжа по переменным , , , , для функционала (8).
В этом случае имеется переменных , , , , , для определения которых можно использовать уравнений (9.2) и условия (5).
Для определения r произвольных постоянных в общем решении уравнения Эйлера-Лагранжа нужно воспользоваться граничными условиями (3). Отметим, что управления , когда , в общем случае могут представлять собой кусочно-непрерывные функции времени.
Тогда в точках разрыва непрерывности управления траектория системы (2) имеет излом. В этой точке должны выполняться условия Вейерштрасса - Эрмана, которые для данного случая имеют вид:
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.