.АЛГОРИТМ ОБУЧЕНИЯ МОДЕЛИ МНОГОМЕРНОГО ПРОЦЕССА
В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ
Гольцов А. С., ВПИ (филиал) ВолгГТУ
В теории управления сложились два основных подхода к описанию неопределенностей математической модели системы управления: стохастический и детерминированный. В стохастических моделях систем управления возмущающие воздействия считают случайными процессами с известными вероятностными характеристиками и используют принцип разделения (достоверной эквивалентности). Однако в задачах управления нелинейными объектами принцип разделения выполняется только в тех случаях, когда математические описания объекта управления (ОУ) и оптимальных траекторий перехода управляемых переменных в требуемое состояние известны с точностью до постоянных параметров, а возмущающие воздействия являются центрированными белыми гауссовскими шумами. Но в реальных ситуациях часто известны оптимальные траектории только для части переменных состояния ОУ, а для остальных переменных с помощью неравенств задано лишь множество допустимых траекторий перехода этих переменных в требуемое состояние. В этих случаях при синтезе систем оптимального управления возникают нелинейные двухточечные краевые задачи (ДКЗ), которые нельзя решать в реальном масштабе времени.
При синтезе
систем управления в детерминированной (минимаксной) постановке предполагается,
что возмущающие воздействия являются сигналами с ограниченной энергией, а
математическое описание ОУ известно с точностью до постоянных (либо медленно
изменяющихся) параметров, принадлежащих ограниченному множеству допустимых
значений. Цель управления состоит в достижении наилучшего качества управления
при наихудшей для выбранного управления реализации последовательности
возмущающих воздействий. Структурную идентификацию передаточной функции замкнутой
системы управления осуществляют методами - и
-
оптимизации. Оценивание переменных состояния и параметров математической модели
системы управления осуществляют с помощью алгоритмов скоростного градиента,
стохастической аппроксимации и другими методами. Однако эти методы синтеза
системы управления можно применять только в линейной постановке задачи управления.
Такая система управления не должна содержать интегрирующие звенья (а их
включают в системы управления для обеспечения астатических свойств) и
ограничения в форме неравенств на траектории перехода управляемых переменных в
требуемое состояние. Кроме того, управляющие воздействия формируют в виде
сигналов с ограниченной энергией, поэтому такие управляющие воздействия, как
правило, нельзя применять в реальных задачах управления (абсолютная величина
сигналов с ограниченной энергией с течением времени должна уменьшаться до нуля).
Решение задачи синтеза систем автоматического управления нелинейными процессами в условиях неопределенности предлагается выполнять с помощью регуляризации традиционной постановки задачи адаптивного управления. Предполагается, что математическая модель ОУ задана в пространстве состояний с помощью нелинейных уравнений:
;
;
;
;
:
,
где: - вектор переменных состояния ОУ;
- вектор управляющих воздействий;
- вектор возмущающих воздействий
на модель ОУ;
- вектор погрешностей задания начального состояния ОУ;
– вектор выходных переменных измерительных
устройств (ИУ);
– вектор
погрешностей измерений;
- предел допустимой погрешности j-го ИУ. Вектор
образован погрешностями математического описания
скоростей изменения переменных состояния ОУ первым слагаемым правой части
уравнения (1.1) и другими неконтролируемыми факторами. Возмущающие воздействия
подлежат оцениванию в процессе управления. Кроме того, с помощью неравенств
;
;
.
задано множество допустимых траекторий перехода ОУ из начального состояния в конечное состояние.
С помощью В-сплайнов n-го порядка математическую модель изменения во
времени оценок вектора
входных (обучающих) воздействий на модель ОУ можно задать в k-м интервале
непрерывности сплайнов уравнением:
;
;
;
,
где - интервал непрерывности
сплайнов;
- матрица известных финитных функций времени
;
- вектор параметров, подлежащих
идентификации;
- вектор погрешностей аппроксимации, которые по условию состоятельности
оценок
могут быть сигналами
с ограниченной энергией.
Такую задачу оценивания переменных состояния ОУ можно теперь
рассматривать как детерминированную задачу оптимального управления моделью ОУ:
определить обучающие воздействия на модель ОУ минимизацией регуляризованного по
А.Н. Тихонову функционала обобщенной работы (РФОР). Для этого В скользящем
временном окне (протяженностью
) сформируем скалярную переменную, образованную
нормированной суммой средних абсолютных значений сигналов рассогласования:
.
Это дополнительное уравнение наблюдения содержит в явном виде информацию о прошлых состояниях объекта и его модели. Поэтому его необходимо включить в РФОР.
С помощью метода неопределенных множителей Лагранжа с последующим применением метода инвариантного погружения к возникающей ДКЗ получено решение этой задачи в виде регуляризованного алгоритма рекуррентного МНК. Полученный алгоритм отличается от традиционного алгоритма рекуррентного МНК тем, что осуществляет ПИ-регулирование обучающих воздействий на модель ОУ. Поэтому этот алгоритм формирует состоятельные оценки переменных состояния ОУ. Кроме того, показано, что полученный алгоритм асимптотически устойчив и формирует устойчивое решение задачи оценивания переменных состояния ОУ с произвольными возмущающими воздействиями. Требуемую близость к оптимальному решению можно обеспечить выбором значений параметра регуляризации и интервала непрерывности сплайнов.
Этот алгоритм был использован в проточном вискозиметре, предназначенном для непрерывного контроля вязкости нефтепродуктов, полимеров и других продуктов в процессе их производства.
Уважаемый посетитель!
Чтобы распечатать файл, скачайте его (в формате Word).
Ссылка на скачивание - внизу страницы.