Планирование экстремальных экспериментов при оптимизации технологических процессов РЕА, страница 2

1.2 Метод оптимального управления дискретными системами

Метод оптимального управления дискретными системами сводится к некоторому количеству задач, решаемых на отыскание максимума (минимума) параметра системы. Решение этих задач  позволяет сделать обобщение, которое сводится к следующему [11].           Пусть переменная t, например время, принимает дискретное множество значений, t=0,1,… , N, где  N–фиксированное натуральное число, и имеется управляющий параметр U. Предполагается, что можно воздействовать на управляемый объект, выбирая rуправляющих параметров U, U, … , … , U, или, то же самое, точку Uпространства переменных U, U, … , U.

Таким образом , в каждый момент t управляющая точка U(t) имеет r координат

                              U(t) =[ U(t), … , U(t)].                                                   (1.1)

Последовательность точек U(1), U(2), … , U(N)                                          (1.2)

в пространстве  переменных U, … , U называют  УПРАВЛЕНИЕМ  [11].

В каждый момент времени t состояние системы характеризуется n – фазовами координатами x, … , x, т.е. точкой  xпространства Е  переменных x, … , x.

Таким образом, в каждый момент времени t фазовое состояние  x(t)  имеет n координат

x(t)=[x(t),…,x(t)]

          Последовательность х(0), х(1), …, х(N)                                                      (1.3) состояний объекта в моменты t=0,1,…,N называют  т р а е  к т о р и е  й   движения объекта. Начальное состояние х(0) обычно задано, а дальнейшее поведение системы однозначно определяется, если выбрано некоторое управление, т.е.

U(1), U(2), …, U(N).

С помощью соотношений

x(t)=f [x(t-1), u(t)], t=1 …, N,                                    (1.4)

где f(х,u)=[f(x,u)…, f(x,u)] – некоторая вектор – функция со значениями в пространстве Е. Индекс t у функции f(х,u) означает, что рассматривается не одна функция f (х,u) для всех моментов t=1,…N, в различные функции, меняющиеся от одного момента времени к другому.

Соотношение (1.4) представляет собой     з а к о н   д в и ж е н и я дискретного управляемого объекта.

Решая задачу оптимального управления, обычно рассматривают лишь такие управления U(1), U(2), …, U(N), которые удовлетворяют условно

                                          U(t) U [x(t-1)], t=1,…,N,                                           (1.5)

где траектория х(0), х(1), …,х(N) исходит из начальной точки х(0) и соответствует управлению(1.2).

Соотношения (1.4) и (1.5) и определяют дискретный управляемый объект. Оптимальное управление такого объекта осуществляется следующим образом [11]. Предполагается, что заданы некоторые функции f(x,u), t=1,…,N. В качестве критерия эффективности, т.е. ф у н к ц и о н а л а, показывающего, насколько выгодно был выбран процесс (1.2) и (1.3), принимают следующий:  

y = f [x, U(1)]+ f[x(1), (2)] + … f [x(N-1), U(N)]= f [x(t-1), U(t)]              (1.6)                                  

Задача оптимального управления заключается в том, чтобы, зная начальное состояние х(0), выбирать  такое допустимое управление (1.2) для объекта (1.4) и (1.5), которое придает функционалу (1.6)  м а к с и м а л ь н о е  значение. В некоторых случаях речь может идти о минимальном значении функционала.

Эта задача называется основной и характеризуется как задача оптимального управления с  з а к р е п л е н н ы м   л е в ы м  концом и  с в о б о д н ы м   правым концом, т.е. имеется в виду, что начальное состояние х(0) задано, а состояние в правом конце отрезка времени х(N) ничем не связано.

Кроме основной задачи, встречаются задачи с подвижными концами, которые решаются аналогично основной, но после преобразований исходных данных и приведения их к рассмотренному виду. В [11] рассматриваются и другие случаи дискретного управления, но все они могут быть приведены к изложенной схеме решения.