(1)
(2)
на интервале времени . То есть, решаем задачу Коши.
При интегрировании этой системы дифференциальных уравнений по формуле:
можно получить управление , которое доставляет минимум
функционалу:
А теперь рассмотрим метод прогонки.
Полагаем, что векторы и
связаны
соотношением:
(3)
Здесь -
квадратичная симметричная матрица размера
,
которое подлежит определению.
Продифференцируем уравнение (3) по времени:
(4)
Подставим уравнения (3) и (4) в (2) и получим:
(5)
Теперь (1) подставим в (5) и вновь учтем (3) и получим:
Или:
(6)
Здесь учтено свойство симметрии
матриц. То есть если - симметричная матрица, то
справедливо следующее соотношение:
Так как вектор , то из уравнения (6) следует:
(7)
Это матричное дифференциальное уравнение Риккати.
Чтобы проинтегрировать выражение
(7), вычислим значение при
. Для этого воспользуемся
равенствами:
Приравняем правые части этих равенств:
Откуда следует:
(8)
Уравнение (7) можно
проинтегрировать (прогнать) от конечного значения к
начальному значению
. Это так называемое
интегрирование в обратном времени.
После этого с помощью уравнения:
вычислим начальное значение
времени .
Теперь решение системы дифференциальных уравнений (1) и (2):
где начальные значения и
заданы,
может быть получено путем интегрирования в прямом времени. При выполнении
интегрирования системы ДУ (1) и (2) с помощью формулы:
(9)
можно вычислить уравнение системы в каждый момент времени. Отметим, что это уравнение по принципу обратной связи. При этом коэффициенты обратной связи:
являются переменными, то есть зависят от времени.
Линейная стационарная система с бесконечным временем управления
Задача формулируется следующим образом:
Имеется линейный объект управления:
(1)
Рассмотрим случай, когда . При этом критерий качества системы
может быть представлен следующим образом:
(2)
Здесь и
- положительно определенные матрицы.
Тогда уравнение Риккати запишется следующим образом:
(3)
Здесь, в отличие от функционала:
,
то граничное условие для матрицы
также будут
нулевыми:
Решение уравнения Риккати,
удовлетворявшее граничным условиям, обозначим .
При
это решение имеет предел:
Здесь -
постоянная симметричная положительно определенная матрица, которая является
решением матричного уравнения Риккати:
(4)
В этом случае оптимальное управление принимает следующий вид:
(5)
Теперь уравнение динамики системы запишется следующим образом:
(6)
Из уравнение (5) следует, что и в этом случае оптимальное управление формируется по принципу обратной связи, и оказывается, что замкнутая система обладает свойством асимптотической устойчивости.
Задача оптимизации при ограничениях на управляющее воздействие
До сих пор мы рассматривали
задачи, в которых рассматривается синтез регулятора, когда на управляющее
воздействие не накладывается никаких ограничений. Это значит, что вектор
управления принадлежит открытой области. Но во
многих задачах управления управляющее воздействие
ограничено.
И наиболее часто это ограничение задается неравенствами:
(1)
А это значит, что вектор
управления принадлежит r-мерному
кубу.
Рассмотрим общую задачу оптимизации, которая формулируется следующим образом:
Динамика системы описывается системой ДУ:
(2)
Заданы граничные условия в начале движения системы и в конце:
(3)
Требуется определить управление , которое переводит из заданного
начального состояния системы (2)
в конечное
, и удовлетворяет ограничениям (1),
и чтобы для этого управления
, и соответствующей
ему траектории
, функционал:
(4)
достигает минимума.
Здесь:
-
n-мерный вектор состояния системы;
-
r-мерный вектор управляющей функции.
Чтобы применить метод
вариационного исчисления для решения этой задачи, введем в рассмотрение
вспомогательные управляющие функции и
вспомогательное соотношение:
(5)
Вспомогательные зависимости (5)
выберем таким образом, чтобы совокупность этих равенств позволила перейти от
замкнутой области изменения переменных или управляющих функций к открытой области для переменных
,
.
Такой переход может быть
осуществлен различными способами, которые зависят от вида функции .
Например:
(6)
Если функция задана следующим образом, то для
этой цели можно использовать функции вида:
(7)
Здесь:
Теперь задачу оптимального управления можно сформулировать следующим образом:
Требуется определить функции ,
,
которые удовлетворяют условиям (5), чтобы эти управления и соответствующая
траектория
системы (2) доставляли минимум
функционалу (4). Траектория
должна
удовлетворять граничным условиям (3).
Эта задача представляет собой задачу Лагранжа на условный экстремум. В соответствии с методикой решения Лагранжа введем вспомогательный функционал:
(8)
Составим уравнение Эйлера-Лагранжа:
(9.1)
(9.2)
(9.3)
В этих уравнениях через обозначена функция:
К этим уравнениям надо добавить
уравнение объекта (2) и соотношение (5), которые представляют собой уравнение
Эйлера-Лагранжа по переменным ,
,
,
,
для
функционала (8).
В этом случае имеется переменных
,
,
,
,
,
для определения которых можно использовать
уравнений
(9.2) и условия (5).
Для определения r
произвольных постоянных в общем решении уравнения Эйлера-Лагранжа нужно
воспользоваться граничными условиями (3). Отметим, что управления , когда
,
в общем случае могут представлять собой кусочно-непрерывные функции времени.
Тогда в точках разрыва непрерывности управления траектория
системы (2) имеет излом. В этой
точке должны выполняться условия Вейерштрасса - Эрмана, которые для данного случая
имеют вид:
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.