Vk(k) = тт\М [(x'k+iQk+iXk+i + u'kRkuk)fzk] -f- •
+ minAf |( V x'tQtxt+ Ut-iRt~iut-iW, wj]. (IV.55)
Uk+V ■ ■ ■ >uN-l L\ t^+2 ) JJ
Используя (IV.52), легко (IV.55) преобразовать к виду Ml гшпЛГ Г V xtQtxt-\-Ut-iRt-iUt-i/zk,uk) 1 =
= М \VN (k + 1 )/zK «ft}, (IV.56)
VN (k) ± min M {(4+1^+1^+1 -f ulRkuk + ^лг (^ + *)/**» «J.
(IV.57)
Полученное соотношение (IV.57) и является рекуррентным функциональным уравнением динамического программирования, которое будет использовано нами для синтеза оптимальной системы управления запасами.
Рассмотрим синтез оптимального управления на последнем (N—-\)-мшаге, для которого, функциональное уравнение примет вид
= min M {x'NQNx?N + u'n-iRn^Un-xIz^1}. (IV.58)
«ЛГ-1
Выразим xN через Un-u используя уравнение состояния:
^ = Фл^-1^лг-1 + t^v-i«^-i + Гаг—iOB»iv—i - (IV. 59)
Подставляя (IV.59) в (IV.58), получим
l)= min M
$ X
'\+2wN-lTN.-lQN$N-.iUN-l]lzN-l\. (IV.60)
Учитывая статистическую независимость xN-i, Wn-u а также то, что M{WN-i} = 0, получим
М [ZXN-l&N-liiN-lTN-lWi-l] = 0.
В свою очередь, требование физической реализуемости в случае нерандомизированной стратегии означает, что является детерминированной функцией вида (IV.51).
134
3 силу статистической независимости w% и г* для всех />7, j—i, 2, ..., N—1 следует, что
M{2W'N^rN^QN%~iUN^\^0.^ (IV.62)
Кроме того, из соотношения (IV,52) следует М {
u
/-/ ~ - \ л/—» (IV.оо)
Л* \uN-i (^-iQat-i^-i + /?лг) / }
Обозначим условное математическое ожидание вектора со-стояния х:
xN^ = М {хх-г/г"'1}. (IV.64)
Тогда (IV.60) можно переписать в виде VN (N — 1) = rriin
^^ ..,...,. (IV.65)
Так как выражение, стоящее в первой квадратной скобке, не зависит от uN-u то цолучим следующее уравнение для вычисления оптимального управления:
VN (N — 1) = min {им №n-iQn4>n-i + Rn-i) uN-i
uN-l
' , ;•..■■ \- (IV.66)
c-ткуда необходимое условие экстремума. легко получить, используя правила векторного дифференцирования:
-l&N-lQN-ltyN-l ='0 (IV.67)
или сокращение:
Aftv-i = 6, ■ (IV.68)
гдеr- - V■'■■ . ■< ■ ■■..
A = ^>n-iQn^>n-i -\-Rn-i- •'-■■■"
Таким образом, для нахождения оптимального управления Un-i требуется обращение матрицы А. Так кар матрица Л является вырожденной (следует из наличия запаздываний в системе), обычное обращен»© невозможно, поэтому будем использовать псевдообращение по Муру—Пенроузу.
135
■ ■ Приведя псевдообращенйе матрицы А, найдем вектор ойти-мального управления
i, (IV.69)
где #—-операция псевдообращения матриц.
Перейдем теперь к вычислению оптимального управления на (N—2)-м шаге:
Vn(N — 2) = min M {(xn'-iOn-iXh-x + u'N-2Rn-2Un-2) -f
' '• ' UN~2 '■-■■ • ■ ■■ - ■ ■ ' ;■-
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.