Если начальная точка
и конечная точка
не фиксирована в пространстве X, а принадлежит начальному многообразию
размерности
и
конечного многообразию
размерности
, то к условиям теоремы необходимо
добавить условие трансверсальности в начальных и конечных точках.
Сказано, что n-мерная
вектор-функция
удовлетворяет условию
трансверсальности в начальной или конечной точке траектории, если вектор
или
ортогональны
касательной плоскости, проведенной к многообразию
в
точке
или к
в
точке
. Это иллюстрирует следующий рисунок:

Таким образом, если концы
траектории не фиксированы, то вектор-функции
,
помимо условий (1) и (2), должны также удовлетворять условиям
трансверсальности. Условие трансверсальности позволяет определить
соотношений между координатами
и
.
Добавим к ним
соотношений.
Это все позволяет получить достаточную систему соотношений для решения задач оптимального управления.
Доказательство
Приведем доказательство теоремы
для задач со свободным правым концом и фиксированным временем
.
Пусть
-
оптимальное управление,
- соответствующая
ему траектория.
Рассмотрим малый интервал времени
, где
и
. Передадим управлению
приращение на промежутке
, не изменяя значение управляющей
функции
вне этого интервала. Здесь не
требуется, чтобы приращение
, где
, было малой величиной. Если
управление ограничено неравенствами
, то приращение
удовлетворяет условию
.
Такие вариации носят название игольчатыми вариациями.

Найдем отклонение траектории системы, которое вызвано изменением управляющей функции:
![]()
В силу непрерывности функции
разность
также
имеет порядок малости
, поэтому запишем:
(13)
Из выражения (13) следует, что в
момент времени
вариация имеет порядок малости
. Здесь выражение (14) – это вариация
координат системы:
(14)
Согласно теореме о непрерывной
зависимости от начальных условий, когда
,
вариации координат также будут иметь порядок малости
.
Теперь для траектории имеем соответствующую систему уравнений:
![]()
Теперь стандартный прием. Мы
разложим правые части системы
в ряд Тейлора:
(15)
Учитываем члены первого порядка малости.
Введем квадратичную матрицу
размера
частных производных:

Теперь уравнение (15) запишем в векторной форме записи:
(16)
Введем в рассмотрение (n+1)-ый вектор
, который
удовлетворяет уравнению:
(17)
Это уравнение в координатной форме имеет вид:
Рассмотрим скалярное произведение
. В силу того, что справедливо равенство:

это скалярное произведение
постоянно, когда
.
Примем во внимание, что есть
равенство
. А по условию теорему управление
доставляет заданному функционалу
минимум. Тогда, для управления,
отличного от оптимального, будет справедливо неравенство:
![]()
Теперь зададимся граничными
условиями на векторной функции
:
(18)
Тогда будет выполняться неравенство:

Учитывая, что:
![]()
получаем:

Подставляя в это неравенство выражение:
![]()
будем иметь:

Откуда получаем, с учетом
:

В качестве момента времени
можно выбрать любой момент из
промежутка
, поэтому окончательно можно
записать:
![]()
где функция
определена равенством (8), а
- это оптимальное управление.
Необходимость теоремы 1 доказана.
Граничным условиям (18) соответствует ненулевое решение системы (17). Отметим, что граничные условия (18) вытекают из условия (2) теоремы и условия трансверсальности для свободного правого конца траектории.
Покажем, что принцип максимума
позволяет из всех траекторий, которые начинаются в точке
и проходящих через точку
, выделить лишь отдельные
изолированные траектории, удовлетворяющие необходимым условиям. Лишь эти
оптимальные изолированные траектории и могут оказаться оптимальными, так как
принцип максимума дает лишь необходимое условие оптимальности.
Всего в формулировке принципа
максимума имеется 2n+2r
независимых функций
,
,
и столько же соотношений. То есть
имеется полная система для определения этих переменных.
Действительно, уравнение (11) в
условиях теоремы дает r соотношений между неизвестными
функциями, если
является внутренней точкой
множества U, то для выполнения условия максимума
необходимо обращение в нуль r частных производных:
![]()
Если точка
лежит на (r-1)-мерной
грани области U, то есть одна из управляющих функций
принимает предельное значение, то
должно выполняться условие принадлежности точки
этой
грани, что дает одно соотношение, и для выполнения условия максимума
функционала H должны обращаться в нуль ее частные
производные, то есть производные функции
по
всем параметрам этой грани (по всем остальным управлениям).
Помимо соотношений (11) мы имеем
систему из 2n+2 уравнений (9) и (10). Таким образом из
всего имеется 2n+2+r
соотношений (9), (10), (11) для определения
,
,
неизвестных.
Общее решение уравнений (9) и
(10) содержит 2n+2 производных постоянных, но одна из
них несуществующей, так как
является
линейной и однородной функцией переменных
.
С учетом изложенного, решение
системы (9), (10), (11) зависит от 2n параметров. Их
нужно подобрать так, чтобы при
траектория
проходила через точку
, а при
-
через точку
, то есть через прямую П. Число
также является параметром. Всего
имеем 2n+1 параметров, которые подлежат определению.
Условие прохождения траектории
через точку
и прямую П дает 2n+1
условий, поэтому можно ожидать, что имеются отдельные изолированные траектории
соединяющие точку
с прямой П и удовлетворяющие
требованиям теоремы принципа максимума. Если в частности условиям теоремы
удовлетворяет единственная траектория, а из физических соображений ясно что
оптимальная траектория существует, то найденная траектория будет оптимальной.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.