Лекция 6.
Тема: Методы вариационного исчисления.
1. Постановка задачи оптимального управления как вариационной задачи.
2. Классификация задач оптимального управления: по виду ограничений, по виду краевых условий, по критерию оптимальности..
3. Необходимые условия экстремума функционала: уравнения Эйлера.
4. Достаточные условия экстремума функционала: условия Лежандра.
5. Задача оптимального управления на условный экстремум.
6. Каноническая форма уравнений Эйлера-Лагранжа.
Задачей вариационного исчисления является задача отыскания функций, доставляющих экстремальное (максимальное или минимальное) значение определенным величинам, которые зависят от этих функций и называются функционалами. Функционал можно рассматривать как функцию особого рода, в которой роль независимой переменной играет другая функция.
Задача синтеза (построения) оптимального управления формулируется как вариационная задача. При этом кроме уравнений объекта управления должны быть заданы ограничения на управление и фазовые координаты, краевые условия и выбран критерий оптимальности.
Пусть уравнение объекта задается в нормальной форме
(6.1)
или в скалярном виде
,
где
– фазовый вектор;
–
вектор управления. Известно, что любое уравнение, разрешимое относительно
старшей производной, можно преобразовать к равносильной нормальной системе
уравнений.
На управление и фазовый вектор могут быть наложены ограничения в виде конечных соотношений – равенств, неравенств. Их в общем виде можно записать так:
,
. (6.2)
Здесь и
– некоторые заданные
множества, зависящие, вообще говоря, от времени, причем
и
. В (6.2) первое
соотношение называется ограничением на управление, второе соотношение – ограничением
на фазовый вектор или фазовым ограничением. Ограничения на
управление и фазовый вектор могут быть не разделены, и в общем случае записаны
в виде
.
Краевые (граничные) условия – ограничения на фазовый
вектор в начальный и конечный
моменты времени в общем виде можно
записать так:
.
(6.3)
Вектор называют левым,
а вектор
– правым концом траектории. Краевые
условия имеют вид (6.3), если ограничения на левый и правый конец траектории разделены.
В противном случае они записываются в виде
Критерий оптимальности, который является числовым показателем качества системы, задается в виде функционала
.
(6.4)
Задача оптимального управления формулируется следующим образом:
Определение.
При заданных уравнении объекта управления (6.1), ограничениях (6.2) и краевых
условиях (6.3) требуется найти такое управление и
фазовую траекторию
, при которых критерий (6.4) принимает
минимальное (или максимальное) значение. Тогда управление
и траектория
называются
оптимальными.
В дальнейшем для определенности примем, что функционал
(6.4) минимизируется. Задачу максимизации выбором нового критерия всегда можно свести к задаче минимизации.
В зависимости от вида ограничений (6.2), вида краевых условий (6.3), времени начала и окончания процесса управления, а также критерия оптимальности (6.4) выполняется классификация задач оптимального управления.
1. По виду ограничений различают задачи:
a) классического типа, когда ограничения задаются в виде равенства
;
(6.5)
b) неклассического типа, когда ограничения задаются в виде неравенств
.
(6.6)
К классическому типу относятся также изопериметрические задачи, т.е. задачи с изопериметрическими ограничениями:
.
(6.7)
Введением дополнительных переменных от изопериметрических ограничений всегда можно избавиться. Достаточно вместо изопериметрических ограничений (6.7) в условие задачи ввести следующие уравнения и краевые условия:
,
,
Формально задачи неклассического типа введением дополнительных переменных можно преобразовать к задачам классического типа. Действительно, ограничения (6.6) можно заменить ограничениями типа равенств
.
Задачи оптимального управления неклассического типа могут иметь ограничения вида
.
Введением дополнительных переменных эти ограничения могут быть заменены соотношениями
,
,
.
2. По виду краевых условий различают задачи:
a)
с фиксированными (закрепленными)
концами траектории, когда каждое из множеств и
состоит из одной точки, т.е.
,
,
и
–
заданные точки;
b)
с подвижным правым концом ( состоит более чем из одной точки), с
подвижным левым концом (
состоит более чем из
одной точки), с подвижными концами (оба конца подвижны);
c)
со свободным правым концом ( совпадает со всем фазовым пространством,
т.е. правый конец траектории без ограничений).
3. По времени начала и окончания процесса различают задачи:
a)
с фиксированным временем, когда
начальный и конечный
моменты
времени фиксированы;
b)
с нефиксированным временем, когда
один из моментов времени или
не фиксирован.
4. По критерию оптимальности различают:
a) задачу Больца; при этом критерий имеет вид
b) задачу Лагранжа; при этом критерий имеет вид
;
c) задачу Майера; при этом критерий имеет вид
.
Задача Майера в частном случае, когда функционал имеет
вид , называется задачей максимального
(оптимального) быстродействия.
Задачи Больца, Лагранжа и Майера эквивалентны в том смысле, что путем преобразования переменных можно от одной задачи перейти к другой.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.