Формулировка задачи синтеза экстремальных систем. Описание экстремальных характеристик. Простейшая непрерывная оценка частной производной. Дискретная оценка частной производной (метод деления конечных разностей). Оценка градиента способом синхронного детектирования. Оценка градиента при помощи специального фильтра. Шаговые экстремальные системы, страница 4

1 – ограничения накладываются на переменные состояния объекта x € ΩXRn(дают некот рабочую область в пространстве состояний). Наиболее часто они носят характер модуля, | xi | ≤ ,  i = 1….n

2) Ограничение на управление u € ΩURm . | uj | ≤ u j max , j = 1…m

Начальные и конечные состояния

 

1 – задача с фиксированными концами

2 – задача с подвижным правым концом.

3 – задача с подвижным левым концом

4 – задача с двумя подвижными концами

3) Критерий оптимальности. Требования к процессу перехода из нач-го состояния в конечное задаётся в виде некот-го обобщённого показателя качества, кот наз-ся критерием оптим-ти. ( минимум по управлению)

Т – длительность процесса. В зависимости от требований к качеству работы системы  м выделить несколько наиболее часто встречающихся критериев оптим-ти:

1) Критерий быстродействия

J = T или  J =  

2) минимум затрат энергии по состоянию

J = p I X I 2 dτ   p I  - весовой коэф-т

J = XTPX dτ (по всему вектору состояния)

3) минимум затрат энергии на управление

J = UT Q U dτ

4) Форма результата.

1.  U 0 = U 0 (t) – программное управление (для систем работающих в режиме вкл/выкл ).

2 . U 0 = U 0 (x) –управление в виде обратной связи (при наличии внешних возмущений).


13. Метод динамического программирования

Основные соотношения метода. Общий класс ОУ:

= f  (x , u),  x € Rn , u € Rm , m ≤ n. Переменные сост-я (| xi | ≤ ,  i = 1….n) и ресурс упр. (| uj | ≤ u j max , j = 1…m) огранич-ы.

Нужно опред-ть управляющее воздействие, кот обеспечивало бы переход из нач-го состояния  x(t) в конечное x(T) за время Т в соответствии с критерием оптимальности

J =  f 0 ( x, u) dτ

Выберем на оптимальной траектории перехода промежуточную точку x(t + Δt), расположенную достаточно близко к заданной нач. точке. По принципу оптим-ти  конечный участок есть также оптимальная траектория, поэтому представим критерий оптим-ти в виде суммы двух критериев, соответствующих двум участкам движения,

 (f0(x,u)+(∂V/∂xT)*)=0. Вместо  подставим правую часть объекта

 ( f 0 ( x, u)  + (∂V / ∂ xT )* f  (x , u)) = 0   (**)

Т о, оптимальным б. управление, кот минимизирует выр-е (**). Но исполь-ть его для вычисления U0 нельзя, т к одно ур-е содержит m+1 неизвестных ( U0 € Rm  и V € R1 ).

Расчётные соотношения метода

В случае оптим-го управления  u = u0 соотношение (**) принимает вид

f 0 ( x, u0 )  + (∂V / ∂ xT )* f  (x , u0 )) = 0 (***)

Продифференцируем по uвдоль оптимальной траектории

f 0 ( x, u0 ) / ∂ u | U=U0 + (∂V / ∂ xT )* ∂ f  (x , u0 ) / ∂ u | U=U0=0 (****).  Добавив (****) к (***) получим систему из m+1 уравнений с m+1 неизвестными, решая кот м найти оптимальное управление. Т к эти уравнения представляют собой ур-я в частных производных, для опред-я из них оптим-го управления, как пр-ло, приходится исп-ть приближ численные методы. В рез-те найденное управление получается не оптимальным, а близким к нему.


14. Задача аналитического конструирования регуляторов (АКОР)

Задача отыскания точного оптимального управления методом динамического программирования носит наз-е задачи АКОР (аналитического конструирования оптимальных регуляторов). Эта задача имеет решение при следующих условиях:

1)  Объект управления описывается линейным уравнением  состояния = A x + Bu , x € Rn , U0 € Rm  , m ≤ n

2)  Переход из нач точки x(0) в  конечную x(T) рассматривается на бесконечном интервале времени (Т → ∞).

3)  Критерий оптимальности имеет вид квадратичной формы 

J =

Оптимальное управление, полученное методом динамического программирования, для такой постановки задачи б иметь вид u0 = Kx  . Т о, оптимальным управление для задачи АКОР будет пропорциональный з-н управления.


15. Принцип максимума Понтрягина

(метод расчёта оптимального управления). Запишем основные соотношения принципа максимума на основе уравнений метода динамического программирования. Основное соотношение:

 ( f 0 ( x, u)  + (∂V / ∂ xT )* f  (x , u)) = 0   (*)

Т к мин. ф-ии равен макс. этой же функции с противоположным знаком , то запишем:

 ( - f 0 ( x, u)  - (∂V / ∂ xT )* f  (x , u)) = 0  (**)