1.2 Метод оптимального управления дискретными системами
Метод оптимального управления дискретными
системами сводится к некоторому количеству задач, решаемых на отыскание
максимума (минимума) параметра системы. Решение этих задач позволяет сделать
обобщение, которое сводится к следующему [11]. Пусть переменная t,
например время, принимает дискретное множество значений, t=0,1,… , N, где N–фиксированное натуральное число, и имеется
управляющий параметр U. Предполагается, что можно воздействовать на
управляемый объект, выбирая rуправляющих
параметров U, U
, … ,
… , U
, или, то же самое, точку Uпространства переменных U
, U
, … ,
U
.
Таким образом , в каждый момент t управляющая точка U(t) имеет r координат
U(t) =[ U(t), … ,
U
(t)]. (1.1)
Последовательность точек U(1), U(2), … , U(N) (1.2)
в пространстве переменных U, … , U
называют УПРАВЛЕНИЕМ [11].
В каждый момент времени t
состояние системы характеризуется n – фазовами координатами x, … ,
x
, т.е. точкой xпространства Е
переменных x
, … ,
x
.
Таким образом, в каждый момент времени t фазовое состояние x(t) имеет n координат
x(t)=[x(t),…,x
(t)]
Последовательность х(0), х(1), …, х(N) (1.3) состояний объекта в моменты t=0,1,…,N называют т р а е к т о р и е й движения объекта. Начальное состояние х(0) обычно задано, а дальнейшее поведение системы однозначно определяется, если выбрано некоторое управление, т.е.
U(1), U(2), …, U(N).
С помощью соотношений
x(t)=f [x(t-1),
u(t)], t=1 …, N,
(1.4)
где f(х,u)=[f
(x,u)…,
f
(x,u)] – некоторая вектор – функция со значениями в
пространстве Е
. Индекс t
у функции f
(х,u) означает, что рассматривается не одна функция f
(х,u) для всех
моментов t=1,…N, в различные функции, меняющиеся от одного момента
времени к другому.
Соотношение (1.4) представляет собой з а к о н д в и ж е н и я дискретного управляемого объекта.
Решая задачу оптимального управления, обычно рассматривают лишь такие управления U(1), U(2), …, U(N), которые удовлетворяют условно
U(t) U
[x(t-1)], t=1,…,N,
(1.5)
где траектория х(0), х(1), …,х(N) исходит из начальной точки х(0) и соответствует управлению(1.2).
Соотношения (1.4) и (1.5) и определяют
дискретный управляемый объект. Оптимальное управление такого объекта
осуществляется следующим образом [11]. Предполагается, что заданы некоторые
функции f(x,u),
t=1,…,N. В качестве критерия эффективности, т.е. ф у н к ц и о
н а л а, показывающего, насколько выгодно был выбран процесс (1.2) и (1.3),
принимают следующий:
y = f [x
, U(1)]+ f
[x(1), (2)] + … f
[x(N-1), U(N)]=
f
[x(t-1), U(t)]
(1.6)
Задача оптимального управления заключается в том, чтобы, зная начальное состояние х(0), выбирать такое допустимое управление (1.2) для объекта (1.4) и (1.5), которое придает функционалу (1.6) м а к с и м а л ь н о е значение. В некоторых случаях речь может идти о минимальном значении функционала.
Эта задача называется основной и характеризуется как задача оптимального управления с з а к р е п л е н н ы м л е в ы м концом и с в о б о д н ы м правым концом, т.е. имеется в виду, что начальное состояние х(0) задано, а состояние в правом конце отрезка времени х(N) ничем не связано.
Кроме основной задачи, встречаются задачи с подвижными концами, которые решаются аналогично основной, но после преобразований исходных данных и приведения их к рассмотренному виду. В [11] рассматриваются и другие случаи дискретного управления, но все они могут быть приведены к изложенной схеме решения.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.