Если начальная точка и конечная точка
не фиксирована в пространстве X, а принадлежит начальному многообразию
размерности
и
конечного многообразию
размерности
, то к условиям теоремы необходимо
добавить условие трансверсальности в начальных и конечных точках.
Сказано, что n-мерная
вектор-функция удовлетворяет условию
трансверсальности в начальной или конечной точке траектории, если вектор
или
ортогональны
касательной плоскости, проведенной к многообразию
в
точке
или к
в
точке
. Это иллюстрирует следующий рисунок:
Таким образом, если концы
траектории не фиксированы, то вектор-функции ,
помимо условий (1) и (2), должны также удовлетворять условиям
трансверсальности. Условие трансверсальности позволяет определить
соотношений между координатами
и
.
Добавим к ним соотношений.
Это все позволяет получить достаточную систему соотношений для решения задач оптимального управления.
Доказательство
Приведем доказательство теоремы
для задач со свободным правым концом и фиксированным временем .
Пусть -
оптимальное управление,
- соответствующая
ему траектория.
Рассмотрим малый интервал времени
, где
и
. Передадим управлению
приращение на промежутке
, не изменяя значение управляющей
функции
вне этого интервала. Здесь не
требуется, чтобы приращение
, где
, было малой величиной. Если
управление ограничено неравенствами
, то приращение
удовлетворяет условию
.
Такие вариации носят название игольчатыми вариациями.
Найдем отклонение траектории системы, которое вызвано изменением управляющей функции:
В силу непрерывности функции разность
также
имеет порядок малости
, поэтому запишем:
(13)
Из выражения (13) следует, что в
момент времени вариация имеет порядок малости
. Здесь выражение (14) – это вариация
координат системы:
(14)
Согласно теореме о непрерывной
зависимости от начальных условий, когда ,
вариации координат также будут иметь порядок малости
.
Теперь для траектории имеем соответствующую систему уравнений:
Теперь стандартный прием. Мы
разложим правые части системы в ряд Тейлора:
(15)
Учитываем члены первого порядка малости.
Введем квадратичную матрицу
размера частных производных:
Теперь уравнение (15) запишем в векторной форме записи:
(16)
Введем в рассмотрение (n+1)-ый вектор , который
удовлетворяет уравнению:
(17)
Это уравнение в координатной форме имеет вид:
Рассмотрим скалярное произведение
. В силу того, что справедливо равенство:
это скалярное произведение
постоянно, когда .
Примем во внимание, что есть
равенство . А по условию теорему управление
доставляет заданному функционалу
минимум. Тогда, для управления,
отличного от оптимального, будет справедливо неравенство:
Теперь зададимся граничными
условиями на векторной функции :
(18)
Тогда будет выполняться неравенство:
Учитывая, что:
получаем:
Подставляя в это неравенство выражение:
будем иметь:
Откуда получаем, с учетом :
В качестве момента времени можно выбрать любой момент из
промежутка
, поэтому окончательно можно
записать:
где функция определена равенством (8), а
- это оптимальное управление.
Необходимость теоремы 1 доказана.
Граничным условиям (18) соответствует ненулевое решение системы (17). Отметим, что граничные условия (18) вытекают из условия (2) теоремы и условия трансверсальности для свободного правого конца траектории.
Покажем, что принцип максимума
позволяет из всех траекторий, которые начинаются в точке и проходящих через точку
, выделить лишь отдельные
изолированные траектории, удовлетворяющие необходимым условиям. Лишь эти
оптимальные изолированные траектории и могут оказаться оптимальными, так как
принцип максимума дает лишь необходимое условие оптимальности.
Всего в формулировке принципа
максимума имеется 2n+2r
независимых функций ,
,
и столько же соотношений. То есть
имеется полная система для определения этих переменных.
Действительно, уравнение (11) в
условиях теоремы дает r соотношений между неизвестными
функциями, если является внутренней точкой
множества U, то для выполнения условия максимума
необходимо обращение в нуль r частных производных:
Если точка лежит на (r-1)-мерной
грани области U, то есть одна из управляющих функций
принимает предельное значение, то
должно выполняться условие принадлежности точки
этой
грани, что дает одно соотношение, и для выполнения условия максимума
функционала H должны обращаться в нуль ее частные
производные, то есть производные функции
по
всем параметрам этой грани (по всем остальным управлениям).
Помимо соотношений (11) мы имеем
систему из 2n+2 уравнений (9) и (10). Таким образом из
всего имеется 2n+2+r
соотношений (9), (10), (11) для определения ,
,
неизвестных.
Общее решение уравнений (9) и
(10) содержит 2n+2 производных постоянных, но одна из
них несуществующей, так как является
линейной и однородной функцией переменных
.
С учетом изложенного, решение
системы (9), (10), (11) зависит от 2n параметров. Их
нужно подобрать так, чтобы при траектория
проходила через точку
, а при
-
через точку
, то есть через прямую П. Число
также является параметром. Всего
имеем 2n+1 параметров, которые подлежат определению.
Условие прохождения траектории
через точку и прямую П дает 2n+1
условий, поэтому можно ожидать, что имеются отдельные изолированные траектории
соединяющие точку
с прямой П и удовлетворяющие
требованиям теоремы принципа максимума. Если в частности условиям теоремы
удовлетворяет единственная траектория, а из физических соображений ясно что
оптимальная траектория существует, то найденная траектория будет оптимальной.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.