Задачи динамической оптимизации
Методические
указания по проведению практических занятий и
самостоятельной подготовки для студентов специальности 21.03 –
«Автоматизация технологических процессов и производств»
УДК 519.6
Задачи динамической оптимизации: Методические указания по проведению практических занятий и самостоятельной подготовки для студентов специальности 21.03 – «Автоматизация технологических процессов и производств»/Сост. О.О. Роднов; КИЦМ. – Красноярск, 1990.
Дана методика расчета задач динамической оптимизации, в том числе с использованием уравнения Эйлера, принципа максимума Понтрягина и уравнения Беллмана.
Рис.2, табл. 1, библиогр. 3 назв.
Практическое занятие 1
Краткая характеристика методов и формулировка задачи
оптимального управления
Задача оптимального управления формулируется как задача достижения экстремума функционала I[X(t), U(t)] путем выбора управления U(t) при соблюдении необходимых ограничений на управление и координаты. Математическим аппаратом для нахождения экстремалей является вариационное исчисление.
Можно выделить три основных метода в вариационном исчислении, используемых для решения задач оптимального управления: применение уравнения Эйлера, принцип максимума и динамическое программирование.
Исторически первым появился метод, использующий уравнение Эйлера. Основные задачи, для которых и была развита Эйлером теория, имели экстремалями гладкие функции, а экстремизируемый функционал и дополнительные условия задавались нелинейными функциями координат. Поэтому уравнение Эйлера целесообразно применять для решения оптимальных задач управления, где по физическому смыслу трудно ожидать решения в виде разрывных функций и где функционал и уравнение связи существенно нелинейны.
К середине пятидесятых годов XX в. практикой автоматического управления была доказана целесообразность применения во многих линейных задачах кусочно-непрерывных управляющих воздействий. Новые задачи обусловили появление нового метода – принципа максимума Понтрягина, который наиболее эффективно дает решение для линейных оптимальных задач при ограничениях на управление в виде неравенств.
Метод динамического программирования, в основу которого положен принцип оптимальности, развился как аппарат исследования многошаговых оптимальных решений в различных отраслях науки и техники. Этот метод наиболее удачно применяется в задачах с дискретным временем и уравнениями в конечных разностях, благодаря удачному сочетанию принципа оптимальности и возможностям современной вычислительной техники.
Задачи динамической оптимизации формулируются следующим образом: необходимо найти такую вектор-функцию U(t) = (u1(t), u2(t), …, um(t)), являющуюся управлением, которая дает минимум функционалу (критерию оптимальности)
(1) |
при математической модели объекта управления вида
(2) |
с краевыми условиями
(3) |
и ограничениях на управление
(4) |
и координаты
, |
(5) |
где X – n-мерный вектор выходных переменных; U – m-мерный вектор входных переменных (управлений).
В случае отсутствия ограничений (4) и (5) задача становится классической задачей вариационного исчисления, основанной на уравнении Эйлера.
В выражении критерия оптимальности (1) первый член представляет собой потери в случае, если конечное состояние объекта управления (значения выходных переменных по окончании процесса управления) отличаются от заданных, второй член отражает потери или затраты на управление объектом управления с уравнением (2) для достижения поставленной цели, определяемой краевыми условиями (3). Краевые условия определяют начальные X(t0) и конечные X(tk) значения вектора выходных переменных во время начала t0 и конца tk процесса управления. Ограничения (4) и (5) вызваны конструктивными, энергетическими и технологическими особенностями объекта управления. Следует отметить, что не обязательно задавать время управления tk и конечное значение выходных переменных X(tk).
Рассмотрим кратко методы решения задач динамической оптимизации. Введем скалярную функцию Н, называемую гамильтонианом,
, |
(6) |
где G(X, U, t) – подынтегральное выражение критерия оптимальности I (1); fi(X, U, t) – правые части уравнений объекта управления; li – множители Лагранжа.
Тогда при отсутствии ограничений (4) и (5) необходимые условия оптимальности можно записать:
(7) |
||
(8) |
||
. |
(9) |
Особенностью системы уравнений (7)-(9) является то, что начальное значение множителей li(t0) не задают, а определяют из необходимости обеспечения начальные и конечные условия для уравнения (7). Значения li(tk) при наличии в критерии оптимальности (1) первого члена Ф(X(tk)) определяются второй строкой, а в отсутствии Ф(X(tk)) – li(tk) не определяют.
Решаем уравнение (9) и находим .
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.