Синтез оптимальных наблюдателей переменных состояния нелинейных объектов управления, страница 7

Тогда оценку  переменных состояния , оптимальную по критерию максимума апостериорной вероятности (2.2.8), формирует следующая динамическая система (ПИД-наблюдатель переменных состояния):

,

(2.3.24)

,

(2.3.25)

(2.3.26)

с начальными  условиями (2.3.11), где

,

(2.3.27)

а матрицы ,  и  вычисляют по формулам (2.3.12), (2.3.13) и (2.1.24).

Для доказательства теоремы 2 вновь введем переменную  по формулам (2.2.10) и заменим задачу максимизации условной плотности (2.2.8) на эквивалентную задачу минимизации функции стоимости (2.2.11) при ограничениях (2.2.1), (2.1.24)-(2.1.27). Дальнейшее доказательство теоремы 2 осуществляется так же, как и доказательство теоремы 1.

ПИД-наблюдатель переменных состояния нелинейного объекта с произвольными шумами. Рассмотрим теперь случай, когда функции распределения вероятности погрешностей измерений  и вектора  погрешностей аппроксимации  неизвестны.

Синтез ПИД‑наблюдателя переменных состояния объекта управления (2.2.1) можно выполнять минимизацией функции стоимости (2.2.11) обобщенного МНК с ограничениями (2.2.1), (2.1.8) и (2.1.24)-(2.1.27). Очевидно, что эта вариационная задача совпадает с вариационной задачей, составленной по условиям теоремы 2. Поэтому ПИД‑наблюдатель (2.3.24)-(2.3.27), (2.3.12), (2.3.13), (2.1.24) формирует оценки переменных состояния нелинейного объекта (2.2.1) с произвольными шумами, оптимальные по критерию (2.2.11) обобщенного МНК.

Пример 1. Нелинейный объект имеет следующие уравнения состояния:

,   ,

(2.3.28)

,   ,

(2.3.29)

где  - пространственная координата объекта в системе координат, в центре которой находится устройство, измеряющее расстояние до объекта:

;

(2.3.30)

,  - скорость движения объекта и управляющее воздействие, недоступные прямым измерениям;  - возмущающее воздей-ствие, которое является неизвестной функцией пространственной координаты объекта;  - постоянная времени объекта, значение которой известно приближенно;  - случайная погрешность измерений с дисперсией .

Объект (2.3.28)-(2.3.30), имеющий постоянную времени  (известное наблюдателю значение постоянной времени ), движется под действием  управляющего и возмущающего воздействий, законы изменения которых от своих аргументов приведены на рисунках 2.5 и 2.6.

На рисунке 2.7 изображен график изменения скорости движения объекта. На рисунке 2.8 приведены результаты измерений текущих значений пространственной координаты этого объекта.

Рис. 2.5. Изменение возмущающего воздействия вдоль пространственной координаты

Рис. 2.6. Изменение управляющего воздействия во времени

Результаты измерений текущих значений пространственной координаты, выполненные с относительной погрешностью , использовались для оценивания текущих значений скорости движения объекта (одновременно с идентификацией его постоянной времени) с помощью рекуррентного метода наименьших квадратов (фильтра Калмана) и алгоритма (2.3.8)-(2.3.13) при величине временного окна  и .

Рис. 2.7. Изменение скорости движения объекта во времени

Рис. 2.8. Изменение во времени выходного сигнала измерительного устройства

Результаты оценивания скорости движения объекта с помощью указанных методов приведены на рисунке 2.9.

Рис. 2.9. Результаты оценивания скорости движения объекта

На рисунке 2.9 изображены изменение во времени действи-тельной скорости движения объекта (линия 2), оценка скорости, вычисленная с помощью разработанного алгоритма (линия 1), и оценка скорости  по алгоритму фильтра Калмана  (линия 3). Резуль-таты моделирования (рис. 2.9) показывают, что в этом примере алгоритм (2.3.8)-(2.3.13) обеспечивает несмещенные оценки скорости движения объекта со среднеквадратическим отклонением погреш-ности оценивания . В то же время оценки фильтра Калмана (линия 2 на рис. 2.9) имеют существенное смещение.

2.4. ПИ-наблюдатель переменных состояния объекта

с неизвестной математической моделью