в момент времени t = tk выполняется соотношение y0(t)
≤ 0 и , X(t)
= 0 (после подстановки в выражение критерия оптимальности I управления U = U*, функция I зависит от y и X).
Рассмотрим в качестве примера управление процессом конвертирования меди, целью которого является получение штейна заданного состава, за заданное время путем продувания расплава воздухом, обогащенным кислородом. Математическое описание процесса конвертирования в рабочем диапазоне изменения количества дутья представляют следующим линейным дифференциальным уравнением:
|
(37) |
где –
расход дутья, являющийся управлением; Х – концентрация сульфидов железа
в расплаве; k –
коэффициент пропорциональности.
Требуется таким образом
изменять управление U(t), чтобы обеспечить достижение
заданного значения концентрации сульфидов в расплаве за определенное время
протекания процесса tk, т.е. X(tk) = и минимум критерия оптимальности
|
(38) |
где b – коэффициент пропорциональности.
Критерий (38) выражает стремление достичь требуемую цель, экономя материальные затраты, связанные с дутьем. В соответствии с выражением (35) составим гамильтониан
|
(39) |
На управление наложены
ограничения типа (5) U – Umax ≤ 0, т.е.
0 ≤ U ≤ Umax.
Необходимые условия оптимальности на основании теоремы принципа максимума запишутся в виде
|
(40) |
Из последнего уравнения системы (40) получим, что
.
Подставив выражение U* в третье уравнение системы (40) и учитывая, что , получим
.
Решая это уравнение, имеем следующее выражение оптимальной траектории
.
Учитывая значение X = , вычислим величину
.
Отсюда определяем , тогда
.
Тогда оптимальное управление U*(t) в соответствии с условием (5) можно записать как:
Таблица 2 – Варианты задач по применению принципа максимума Понтрягина и уравнения Беллмана
Вариант |
Критерий |
Уравнение объекта |
Ограничение |
1 |
kU |
|
0 ≤ U ≤ Umax |
2 |
k1U 2 + k2U |
||
3 |
kU 3 |
|
|
4 |
kU 3 + U |
||
5 |
k1U 2 + k2 |
||
6 |
k1U 3 + k2U 2 |
||
7 |
k1U 3 + k2U 2 + k3U |
||
8 |
k1U 2 + k2U + k3 |
Практическое занятие 4
Динамическое программирование. Уравнение Беллмана и
его применение для решения задач оптимального управления
Классические методы нахождения экстремума функции многих переменных при большом числе переменных могут оказаться неприменимыми, и, поэтому, более целесообразно принимать решения о значениях функции U(ti) не сразу (за один шаг), а постепенно, шаг за шагом. Такие процессы решения называют многошаговыми.
Математическим аппаратом изучения многошаговых оптимальных решений является динамическое программирование, созданное в значительной мере Р. Беллманом и его учениками в пятидесятых годах ХХ в.
Метод динамического программирования базируется на постулате, получившем название принципа оптимальности, и суть его заключается в следующем:
оптимальное поведение обладает тем свойством, что каковы бы ни были первоначальное состояние и решение в начальный момент, последующие решения должны составлять оптимальное поведение относительно состояния, получающегося в результате первого решения.
Для получения необходимых и достаточных условий оптимальности водится скалярная функция S, называемая потенциалом или функцией Беллмана-Ляпунова; как минимальное значение критерия оптимальности, которое получается для заданного в какой-либо момент времени t состояния (X, t) при оптимальном управлении
|
(41) |
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.