Синтез самонастраивающихся регуляторов нелинейных систем автоматического управления, страница 3

В апостериорную модель состояния объекта управления (3.2.1)-(3.2.3), (2.1.13)-(2.1.15), (3.2.5)-(3.2.7) входят линейно гауссовские белые шумы  и , а начальные условия заданы в виде гауссовских случайных величин. Поэтому формула (3.2.8) определяет функцию стоимости МАВ задачи формирования оптимальных оценок управляющих воздействий .

Минимизация функции стоимости (3.2.8) по переменным ,  и  при ограничениях (3.2.1) и (3.2.6) с помощью неопределенных множителей Лагранжа и инвариантного погружения возникающей двухточечной краевой задачи приводит, как это было показано в разделе 2.3, непосредственно к уравнениям (3.3.1)-(3.3.8).

Самонастраивающийся ПИД-регулятор для нелинейного объекта с произвольными шумами. Рассмотрим теперь случай, когда функции распределения вероятности возмущающих воздействий и погрешностей измерений неизвестны. В этом случае формула (3.2.8) определяет квадратичную функцию стоимости обобщенного метода наименьших квадратов. Минимизация функции стоимости (3.2.8) по переменным ,  и  при ограничениях (3.2.1) и (3.2.6) с помощью неопределенных множителей Лагранжа и инвариантного погружения вновь приводит к уравнениям самонастраивающегося ПИД-регулятора (3.3.1)-(3.3.8). Однако полученная таким образом система управления теряет свойство оптимальности.

Для гарантированного выполнения ограничений в форме неравенств (2.1.11) уравнения самонастраивающегося ПИД-регулятора (3.3.2)-(3.3.8) необходимо дополнить уравнением (3.3.1).

Анализ полученных результатов. В настоящем разделе завер-шено решение задачи синтеза адаптивной системы автоматического управления нелинейным многомерным динамическим объектом (2.1.16), (2.1.17) с ограничениями в виде равенств и неравенств (2.1.1), (2.1.5), (2.1.12), (2.1.18), (2.1.22) и функцией стоимости управления (3.2.8).

Получена априорная модель нелинейной системы управления, в которую неизвестные возмущающие и управляющие воздействия входят линейно. В уравнения допустимых фазовых траекторий и в уравнения наблюдений входят линейно белые гауссовские шумы. Критерии максимума апостериорной вероятности оценивания переменных состояния и формирования управляющих воздействий являются квадратичными функционалами. Поэтому при синтезе системы управления можно применять теорему разделения.

С помощью вариационного исчисления и инвариантного погружения получен многомерный самонастраивающийся регулятор управляющих воздействий в виде динамической системы, на вход которой подают выходные сигналы наблюдателя переменных состояния объекта управления. Самонастраивающийся регулятор управляющих воздействий формирует управляющие воздействия, оптимальные по квадратичному критерию (3.2.8), путем интегрирования системы нелинейных дифференциальных уравнений (3.3.1)–(3.3.8) с известными начальными условиями (3.3.4).

Из уравнений (3.3.1)–(3.3.8) следует, что в отличие от существующих разработанный регулятор управляющих воздействий представляет собой систему ПИД-регуляторов с переменными параметрами настройки. Такая структура регулятора управляющих воздействий придает ему астатические свойства.

  Изменяющиеся во времени параметры настройки ПИД-регуляторов вычисляют путем интегрирования матричного уравнения Риккати (3.3.3) с заданным начальным условием (3.3.4), что легко реализовать в реальном масштабе времени.

Известно [21], что если матрица Гессе используемой квадратичной функции стоимости (3.2.8) положительно определена, то матричное уравнение Риккати (3.3.3) имеет асимптотически устойчивое решение при любых погрешностях задания начальных условий (3.3.4).

Если возмущающие воздействия, погрешности измерений и погрешности задания оптимальных фазовых траекторий для переменных состояния объекта управления являются гауссовскими случайными процессами с известными ковариационными функциями, то система управления с ПИД-наблюдателем (2.3.24)-(2.3.27) и ПИД-регулятором (3.3.1)-(3.3.8) оптимальна по критерию МАВ.

При составлении априорной модели системы управления осуществлена регуляризация исходной постановки задачи управления с помощью аппроксимации в скользящем временном окне неизвестных зависимостей от времени возмущающих и управляющих воздействий В-сплайнами. В соответствии с теорией регуляризации некорректно поставленных задач запас устойчивости полученного регулятора управляющих воздействий и обеспечиваемая им точность оценивания полностью определяются величиной параметра регуляризации (величиной используемого временного окна ) [54], [55]. Оптимальное значение параметра регуляризации можно определить для каждого конкретного объекта управления, например, с помощью метода невязки [55].